使用TensorFlow直接获取处理MNIST数据方式

作者:gaoyueace 时间:2022-12-16 22:35:49 

MNIST是一个非常有名的手写体数字识别数据集,TensorFlow对MNIST数据集做了封装,可以直接调用。MNIST数据集包含了60000张图片作为训练数据,10000张图片作为测试数据,每一张图片都代表了0-9中的一个数字,图片大小都是28*28。虽然这个数据集只提供了训练和测试数据,但是为了验证训练网络的效果,一般从训练数据中划分出一部分数据作为验证数据,测试神经网络模型在不同参数下的效果。TensorFlow提供了一个类来处理MNIST数据。

代码如下:


from tensorflow.examples.tutorials.mnist import input_data

#载入MNIST数据集,如果指定地址下没有下载好的数据,那么TensorFlow会自动在网站上下载数据
mnist = input_data.read_data_sets("/tensorflow_google")

#打印训练数据大小
print("Training data size:", mnist.train.num_examples)

#打印验证集大小
print("Validating data size:", mnist.validation.num_examples)

#打印测试集大小
print("Testing data size:", mnist.test.num_examples)

#打印训练样例
print("Example training data", mnist.train.images[0])

#打印训练样例的标签
print("Example training data label:", mnist.train.labels[0])

>>Training data size: 55000
Validating data size: 5000
Testing data size: 10000
Example training data [ 0.     ... 0.    ]
Example training data label: 7

处理后的每一张图片是一个长度为784(28*28)的一维数组,数组中的数据为图片的像素,像素元素取值范围为0-1,代表了颜色的深浅,其中0为白色,1为黑色。为了可以使用随机梯度下降,input_data.read_data_sets生成的类还提供了mnist.train.next_batch,可以从素有的训练数据中读取一小部分作为一个训练batch,例如:


batch_size = 200
xs, ys = mnist.train.next_batch(batch_size) #xs是数据,ys是对应的标签
print("X shape", xs.shape)
print("Y shape", ys.shape)

>>X shape (200, 784) #X是200*784的数组
Y shape (200,) #Y是200维的一维数组

来源:https://blog.csdn.net/gaoyueace/article/details/79056085

标签:TensorFlow,MNIST,数据
0
投稿

猜你喜欢

  • PHP析构函数destruct与垃圾回收机制的讲解

    2023-07-11 21:05:36
  • Python+DeOldify实现老照片上色功能

    2021-07-13 00:04:46
  • python opencv实现图像配准与比较

    2023-03-01 15:30:24
  • Python学习笔记之读取文件、OS模块、异常处理、with as语法示例

    2023-03-20 21:54:58
  • 随Linux开机自动启动mysql

    2009-12-29 10:14:00
  • sql格式化工具集合

    2024-01-14 02:15:14
  • PHP 中文处理技巧

    2024-05-11 09:45:09
  • mysql动态游标学习(mysql存储过程游标)

    2024-01-21 12:58:50
  • Python socket实现的简单通信功能示例

    2023-03-03 07:49:40
  • mysql8.0 windows x64 zip包安装配置教程

    2024-01-15 18:58:34
  • pandas.dataframe按行索引表达式选取方法

    2021-10-28 20:26:32
  • golang中json和struct的使用说明

    2023-10-09 13:09:10
  • 一文了解Hive是什么

    2023-09-27 09:28:47
  • 最具创意的广告牌全集

    2007-09-21 19:54:00
  • python列表的增删改查实例代码

    2021-08-11 04:06:51
  • 如何在Pycharm中制作自己的爬虫代码模板

    2021-03-09 12:07:57
  • golang mysql的连接池的具体使用

    2024-01-14 11:52:10
  • 在python中利用numpy求解多项式以及多项式拟合的方法

    2021-05-14 03:01:24
  • pygame游戏之旅 添加游戏界面按键图形

    2023-06-30 21:48:38
  • MySql 8.0.16版本安装提示已经不使用“UTF8B3”而是使用“UTF8B4”问题

    2024-01-23 12:43:57
  • asp之家 网络编程 m.aspxhome.com