Python 实现训练集、测试集随机划分
作者:no_error_no_warn 时间:2023-02-12 01:41:24
随机从列表中取出元素:
import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)
以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:
import csv
import random
def getDataSet(proportion):
"""
:exception
获取训练集和测试集(将数据按比例随机划分)
:parameter
proportion - 测试集/数据集
:return
trainDataSet - 训练集
testDataSet - 测试集
author
肖政宇
modify
2019年5月10日
"""
dataSet = open('数据集.csv')
dataSetReader = csv.reader(dataSet)
"""
:exception
将数据保存到数组
"""
dataSet = []
next(dataSetReader, 'none') # 跳过表头
data = next(dataSetReader, 'none')
while (data != 'none'):
dataSet.append(data)
data = next(dataSetReader, 'none')
"""
:exception
按照比例随机划分出训练集和测试集
"""
dataNumber = dataSet.__len__() # 数据集数据条数
testNumber = int(dataNumber * proportion) # 测试集数据条数
testDataSet = [] # 测试数据集
trainDataSet = [] # 训练数据集
testDataSet = random.sample(dataSet, testNumber) # 测试集
for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
dataSet.remove(testData)
trainDataSet = dataSet # 训练集
return trainDataSet, testDataSet
来源:https://blog.csdn.net/qq_39514033/article/details/90052508
标签:Python,训练集,测试集,划分
0
投稿
猜你喜欢
JavaScript 数组方法filter与reduce
2024-04-29 13:14:38
对python中 math模块下 atan 和 atan2的区别详解
2023-03-20 06:12:26
FlippingBook使用教程(附下载)
2023-09-26 20:48:25
一篇文章带你学习Python3的高级特性(2)
2021-03-29 13:56:40
mysql向mariadb平滑过渡的步骤详解
2024-01-26 18:12:39
判断目标是否是window,document,和拥有tagName的Element的代码
2024-04-16 08:46:46
Python 图片视频模糊化实现案例
2023-05-28 11:50:52
Go语言常用条件判断空值逻辑的使用
2024-04-25 15:10:07
PHP中$GLOBALS['HTTP_RAW_POST_DATA']和$_POST的区别分析
2023-11-22 22:00:16
Python语法学习之正则表达式的量词汇总
2023-07-20 03:08:59
一个取图片尺寸的类,支持jpg,gif,png
2007-10-18 10:25:00
利用Python如何实现一个小说网站雏形
2023-09-22 05:52:07
go-cqhttp智能聊天功能的实现
2024-04-26 17:30:53
Vue3初探之ref、reactive以及改变数组的值
2024-04-27 16:06:00
M2实现Nodejs项目自动部署的方法步骤
2024-05-13 10:05:21
ASP 高亮显示不区分大小写的关键字
2011-03-09 10:45:00
SQLserver 实现分组统计查询(按月、小时分组)
2024-01-24 12:52:15
vue3.0使用mapState,mapGetters和mapActions的方式
2023-07-02 16:49:56
python调用动态链接库的基本过程详解
2023-05-31 13:24:00
用Mimer Validator检查SQL查询
2024-01-24 17:12:01