pytorch中图像的数据格式实例

脚本专栏 2024/11/2 佚名

3 2 1

圆月山庄资源网 Design By www.vgjia.com

计算机视觉方面朋友都需要跟图像打交道，在pytorch中图像与我们平时在matlab中见到的图像数据格式有所不同。matlab中我们通常使用函数imread()来轻松地读入一张图像，我们在变量空间中可看到数据的存储方式是H x W x C的顺序（其中H、W、C分别表示图像的高、宽和通道数，通道数一般为RGB三通道），另外，其中的每一个数据都是[0,255]的整数。

在使用pytorch的时候，我们通常要使用pytorch中torchvision包下面的datasets模块和transforms模块。而通常情况下在我们使用了这两个模块之后，所处理的图像数据格式已经不是我们所熟知的格式了。

下面按照代码来进行讲解：

#导入需要的包和模块
import torch
from torchvision import datasets, transforms
import os
 
#transforms指明了需要对原始图像做何种变换
data_transforms = transforms.Compose([
    transforms.RandomResizedCrop(224),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
  ])
 
#指明了图像存放的位置；里面可能有好几个文件夹，分别存放不同种类的图像
data_dir = 'original_data'
image_dataset = datasets.ImageFolder(data_dir, data_transforms)
dataloader = torch.utils.data.DataLoader(image_dataset, batch_size=4, shuffle=True, num_workers=4)

代码中首先使用datasets模块读取图像数据，输出的图像类型为PILImage，并且图像中的每一个数据大小范围已经不再是[0,255]，而是[0,1]。datasets模块下有好几个读取图像的类，比如CIFAR10、MNIST等能够直接获取标准数据库；而我们代码中所使用的类是ImageFolder，它能够读取本地存放的图像。其中需要指定图像所在文件路径和需要对数据进行的变换。

从上面的data_transforms变量中我们能够看出进行了多种变换，而Compose就是将多种变换组合起来的方法。data_transforms中一共包含了四个变换，前两个是对PILImage进行的，分别对其进行随机大小（默认原始图像大小的0.08-1.0）和随机宽高比（默认原始图像宽高比的3/4-4/3）的裁剪，之后resize到指定大小224；以及对原始图像进行随机（默认0.5概率）的水平翻转。

第三个transforms.ToTensor()的变换操作是关键一步，它将PILImage转变为torch.FloatTensor的数据形式，这种数据形式一定是C x H x W的图像格式加上[0,1]的大小范围。它将颜色通道这一维从第三维变换到了第一维。

后面的Normalize变换是对tensor这种数据格式进行的，它的操作是用给定的均值和标准差分别对每个通道的数据进行正则化。具体来说，给定均值(M1,...,Mn)，给定标准差(S1,..,Sn)，其中n是通道数（一般是3），对每个通道进行如下操作：

output[channel] = (input[channel] - mean[channel]) / std[channel]

经过上面一系列的转换之后，我们可以得出的结论是，图像的数据格式首先在维度的排序上发生了改变，其次数据的范围也发生了改变。

以上这篇pytorch中图像的数据格式实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

pytorch,图像,数据格式

标签：

pytorch,图像,数据格式

圆月山庄资源网 Design By www.vgjia.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

圆月山庄资源网 Design By www.vgjia.com

评论“pytorch中图像的数据格式实例”

暂无评论...

www.vgjia.com 圆月山庄资源网

139,976互联网资源

144,792高清电影

21,817无损音乐

631,128技术资源

最新文章

转载一个别人收藏的精典网站Ruby,HIBERNATE

2024/11/2

可与Spreadsheets媲美的在线表格系统:EditG

2024/11/2

cygwin使用心得

2024/11/2

脚本的DVD开发

2024/11/2

局域网设置自动配置脚本文件的写法与用途

2024/11/2

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/11/2

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

pytorch中图像的数据格式实例

pytorch,图像,数据格式

python 函数中的参数类型

python正则过滤字母、中文、数字及特殊字符方法详解

评论“pytorch中图像的数据格式实例”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

pytorch中图像的数据格式实例

pytorch,图像,数据格式

python 函数中的参数类型

python正则过滤字母、中文、数字及特殊字符方法详解

评论“pytorch中图像的数据格式实例”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存