python类别数据数字化LabelEncoder VS OneHotEncoder区别
作者:HZ在掘金 时间:2023-10-12 07:46:46
LabelEncoder 和 OneHotEncoder 是什么
- 在数据处理过程中,我们有时需要对不连续的数字或者文本进行数字化处理。
- 在使用 Python 进行数据处理时,用 encoder 来转化 dummy variable(虚拟数据)非常简便,encoder 可以将数据集中的文本转化成0或1的数值。
- LabelEncoder 和 OneHotEncoder 是 scikit-learn 包中的两个功能,可以实现上述的转化过程。
- sklearn.preprocessing.LabelEncoder
- sklearn.preprocessing.OneHotEncoder
数据集中的类别数据
在使用回归模型和机器学习模型时,所有的考察数据都是数值更容易得到好的结果。
因为回归和机器学习都是基于数学函数方法的,所以当我们要分析的数据集中出现了类别数据(categorical data),此时的数据是不理想的,因为我们不能用数学的方法处理它们。
例如,在处理男和女两个性别数据时,我们用0和1将其代替,再进行分析。
由于这种情况的出现,我们需要可以将文字数字化的现成方法。
LabelEncoder 和 OneHotEncoder 的区别
具体代码
import pandas as pd
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.cross_validation import train_test_split
# 读取数据
data_df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/'
'breast-cancer-wisconsin/wdbc.data', header=None)
# 前面的数据是特征,最后一列是标签label
x, y = data_df.values[:, :-1], data_df.values[:, -1]
# 先实例化一个对象
encoder_x = LabelEncoder()
# 对标签进行类别数据数字化
y = encoder_x.fit_transform( y )
来源:https://juejin.cn/post/7018066861132611591
标签:python,LabelEncoder,OneHotEncoder,类别数据,数字化
0
投稿
猜你喜欢
Python库 Bokeh 数据可视化实用指南
2022-09-28 14:54:51
SQL常用日期查询语句及显示格式设置
2024-01-25 06:57:37
Python 编码Basic Auth使用方法简单实例
2023-06-13 22:29:50
Python实现定制自动化业务流量报表周报功能【XlsxWriter模块】
2022-02-12 01:25:05
Python爬虫获取页面所有URL链接过程详解
2022-01-31 10:48:46
mysql递归函数with recursive的用法举例
2024-01-16 22:37:22
Python Socket编程之多线程聊天室
2021-03-23 21:01:02
Django框架CBV装饰器中间件auth模块CSRF跨站请求问题
2021-03-25 09:42:01
Python和Go成为2019年最受欢迎的黑客工具(推荐)
2021-05-22 16:37:17
python使用递归解决全排列数字示例
2022-02-22 04:14:49
SQLserver删除某数据库中所有表实现思路
2024-01-25 21:06:40
MySQL主从同步原理及应用
2024-01-18 07:42:24
python回调函数的使用方法
2023-05-28 02:50:55
PHP开发实现快递查询功能详解
2023-11-24 12:19:39
Vue computed 计算属性代码实例
2024-05-09 15:14:39
pycharm中cv2的package安装失败问题及解决
2022-09-20 09:52:35
python机器学习之决策树分类详解
2023-04-28 14:31:05
python中的字典详细介绍
2021-06-08 23:10:41
golang中select语句的简单实例
2023-09-03 03:01:28
Mac Homebrew安装的MySQL无法远程登录的解决
2024-01-14 12:12:56