我对PyTorch dataloader里的shuffle=True的理解
作者:Doodlera 时间:2022-04-15 19:22:48
对shuffle=True的理解:
之前不了解shuffle的实际效果,假设有数据a,b,c,d,不知道batch_size=2后打乱,具体是如下哪一种情况:
1.先按顺序取batch,对batch内打乱,即先取a,b,a,b进行打乱;
2.先打乱,再取batch。
证明是第二种
shuffle (bool, optional): set to ``True`` to have the data reshuffled
at every epoch (default: ``False``).
if shuffle:
sampler = RandomSampler(dataset) #此时得到的是索引
补充:简单测试一下pytorch dataloader里的shuffle=True是如何工作的
看代码吧~
import sys
import torch
import random
import argparse
import numpy as np
import pandas as pd
import torch.nn as nn
from torch.nn import functional as F
from torch.optim import lr_scheduler
from torchvision import datasets, transforms
from torch.utils.data import TensorDataset, DataLoader, Dataset
class DealDataset(Dataset):
def __init__(self):
xy = np.loadtxt(open('./iris.csv','rb'), delimiter=',', dtype=np.float32)
#data = pd.read_csv("iris.csv",header=None)
#xy = data.values
self.x_data = torch.from_numpy(xy[:, 0:-1])
self.y_data = torch.from_numpy(xy[:, [-1]])
self.len = xy.shape[0]
def __getitem__(self, index):
return self.x_data[index], self.y_data[index]
def __len__(self):
return self.len
dealDataset = DealDataset()
train_loader2 = DataLoader(dataset=dealDataset,
batch_size=2,
shuffle=True)
#print(dealDataset.x_data)
for i, data in enumerate(train_loader2):
inputs, labels = data
#inputs, labels = Variable(inputs), Variable(labels)
print(inputs)
#print("epoch:", epoch, "的第" , i, "个inputs", inputs.data.size(), "labels", labels.data.size())
简易数据集
shuffle之后的结果,每次都是随机打乱,然后分成大小为n的若干个mini-batch.
来源:https://blog.csdn.net/qq_35248792/article/details/109510917
标签:PyTorch,dataloader,shuffle,True
0
投稿
猜你喜欢
如何判断js脚本加载完成
2008-11-04 13:53:00
一种特别简单的MySQL数据库安装方法
2008-12-17 15:30:00
MySQL 通过索引优化含ORDER BY的语句
2010-03-25 10:28:00
asp通过数组给您的文件列表排序
2007-10-22 13:45:00
mdf文件和ldf文件导入到sql server 2005实现语句
2024-01-21 14:38:07
关于python下cv.waitKey无响应的原因及解决方法
2022-03-04 14:51:21
vue中对象数组去重的实现
2024-04-27 16:18:27
vue实现全屏滚动效果(非fullpage.js)
2024-05-28 15:46:00
提升Python运行速度的5个小技巧
2021-07-28 20:25:24
HTTP长连接与短连接使用方法及测试详解
2023-05-08 16:15:25
python计算机视觉OpenCV入门讲解
2021-09-25 08:32:58
二维码的生成细节和原理
2023-02-28 16:36:01
Python Log文件大小设置及备份的方法
2022-08-02 13:46:14
简单实现SQLServer转MYSQL的方法
2024-01-21 20:12:13
为什么Access数据库的精髓不在VBA之中
2008-11-28 16:45:00
mysql 8.0.15 winx64压缩包安装配置方法图文教程
2024-01-23 03:00:13
PHP使用观察者模式处理异常信息的方法详解
2023-10-19 15:53:30
Python unittest基本使用方法代码实例
2023-06-28 06:42:56
SQL Server 排序函数 ROW_NUMBER和RANK 用法总结
2024-01-20 17:16:36
pandas 如何分割字符的实现方法
2021-04-17 11:28:46