Python 实现训练集、测试集随机划分

作者:no_error_no_warn 时间:2023-02-12 01:41:24 

随机从列表中取出元素:


import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:


import csv
import random
def getDataSet(proportion):
 """
   :exception
     获取训练集和测试集(将数据按比例随机划分)
   :parameter
     proportion - 测试集/数据集
   :return
     trainDataSet - 训练集
     testDataSet - 测试集
   author
     肖政宇
   modify
     2019年5月10日
 """
 dataSet = open('数据集.csv')
 dataSetReader = csv.reader(dataSet)
 """
   :exception
     将数据保存到数组
 """
 dataSet = []
 next(dataSetReader, 'none') # 跳过表头
 data = next(dataSetReader, 'none')
 while (data != 'none'):
   dataSet.append(data)
   data = next(dataSetReader, 'none')
 """
   :exception
     按照比例随机划分出训练集和测试集
 """
 dataNumber = dataSet.__len__() # 数据集数据条数
 testNumber = int(dataNumber * proportion) # 测试集数据条数
 testDataSet = [] # 测试数据集
 trainDataSet = [] # 训练数据集

testDataSet = random.sample(dataSet, testNumber) # 测试集
 for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
   dataSet.remove(testData)
 trainDataSet = dataSet # 训练集

return trainDataSet, testDataSet

来源:https://blog.csdn.net/qq_39514033/article/details/90052508

标签:Python,训练集,测试集,划分
0
投稿

猜你喜欢

  • JavaScript 数组方法filter与reduce

    2024-04-29 13:14:38
  • 对python中 math模块下 atan 和 atan2的区别详解

    2023-03-20 06:12:26
  • FlippingBook使用教程(附下载)

    2023-09-26 20:48:25
  • 一篇文章带你学习Python3的高级特性(2)

    2021-03-29 13:56:40
  • mysql向mariadb平滑过渡的步骤详解

    2024-01-26 18:12:39
  • 判断目标是否是window,document,和拥有tagName的Element的代码

    2024-04-16 08:46:46
  • Python 图片视频模糊化实现案例

    2023-05-28 11:50:52
  • Go语言常用条件判断空值逻辑的使用

    2024-04-25 15:10:07
  • PHP中$GLOBALS['HTTP_RAW_POST_DATA']和$_POST的区别分析

    2023-11-22 22:00:16
  • Python语法学习之正则表达式的量词汇总

    2023-07-20 03:08:59
  • 一个取图片尺寸的类,支持jpg,gif,png

    2007-10-18 10:25:00
  • 利用Python如何实现一个小说网站雏形

    2023-09-22 05:52:07
  • go-cqhttp智能聊天功能的实现

    2024-04-26 17:30:53
  • Vue3初探之ref、reactive以及改变数组的值

    2024-04-27 16:06:00
  • M2实现Nodejs项目自动部署的方法步骤

    2024-05-13 10:05:21
  • ASP 高亮显示不区分大小写的关键字

    2011-03-09 10:45:00
  • SQLserver 实现分组统计查询(按月、小时分组)

    2024-01-24 12:52:15
  • vue3.0使用mapState,mapGetters和mapActions的方式

    2023-07-02 16:49:56
  • python调用动态链接库的基本过程详解

    2023-05-31 13:24:00
  • 用Mimer Validator检查SQL查询

    2024-01-24 17:12:01
  • asp之家 网络编程 m.aspxhome.com