pandas 如何将字符串映射为数字

作者:白水baishui 时间:2021-04-15 02:47:33 

pandas 将字符串映射为数字

在有些数据集中,有些数据变量用字符串表示,但为了方便处理,往往想转换为好处理的格式,这时候不一定要用one hot进行编码,也可以直接转成整数:

test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)

但是这样映射的数字是从0开始的,如果有初始要求,可以对映射结果加上某个值,例如,把从0开始变为从15开始:

test_df["xx"] = test_df["xx"].add(15)

效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int):

           user_id         item_id  ratings        time
0       B001GXRQW0   APV13CM0919JD      1.0  1229644800
1       B001GXRQW0  A3G8U1G1V082SN      5.0  1229472000
2       B001GXRQW0   A11T2Q0EVTUWP      5.0  1229472000
3       B001GXRQW0   A9YKGBH3SV22C      5.0  1229472000
4       B001GXRQW0  A34WZIHVF3OKOL      1.0  1229472000
...            ...             ...      ...         ...
147189  B01H5PPJT4  A2K9WVQW9TLWNK      5.0  1536969600
147190  B01H5PPJT4  A149ALSR6TPGF7      4.0  1536278400
147191  B01H5PPJT4  A2Q066NZCQSCOR      5.0  1535500800
147192  B01H5PPJT4  A1KJLWCW7XBS8I      5.0  1534550400
147193  B01H5PPJT4   ANABUB0FRZXRM      5.0  1534204800

        user_id         item_id  ratings        time
0             0   APV13CM0919JD      1.0  1229644800
1             0  A3G8U1G1V082SN      5.0  1229472000
2             0   A11T2Q0EVTUWP      5.0  1229472000
3             0   A9YKGBH3SV22C      5.0  1229472000
4             0  A34WZIHVF3OKOL      1.0  1229472000
...         ...             ...      ...         ...
147189      858  A2K9WVQW9TLWNK      5.0  1536969600
147190      858  A149ALSR6TPGF7      4.0  1536278400
147191      858  A2Q066NZCQSCOR      5.0  1535500800
147192      858  A1KJLWCW7XBS8I      5.0  1534550400
147193      858   ANABUB0FRZXRM      5.0  1534204800

pandas 将某一列的字符值转换为数字

使用map的方法就可以实现把某一列的字符类型的值转换为数字。

class_mapping = {'A':0, 'B':1}
data[class] = data[class].map(class_mapping)

首先定义一个字典,然后使用map方法就可以把某一列的字符类型的值转换为数字。

来源:https://baishui.blog.csdn.net/article/details/123782779

标签:pandas,字符串,映射,数字
0
投稿

猜你喜欢

  • python munch库的使用解析

    2023-11-26 01:42:20
  • 在数据库‘master’中拒绝CREATE DATABASE权限问题的解决方法

    2011-10-24 19:46:55
  • numpy中的norm()函数求范数实例

    2022-01-02 01:36:45
  • 一文详解Python定时任务触发

    2021-05-13 14:27:02
  • python装饰器代码解析

    2021-12-29 19:39:07
  • javascript 密码强度验证规则、打分、验证

    2010-05-18 19:58:00
  • 在ASP处理程序时,进度显示

    2008-08-04 13:27:00
  • python爬虫爬取微博评论案例详解

    2022-12-23 13:31:53
  • 用途相似的标签

    2008-05-23 13:11:00
  • asp如何让页面背景五彩缤纷?

    2010-05-13 16:38:00
  • Python使用pdb调试代码的技巧

    2022-11-18 04:36:06
  • python 字典常用方法超详细梳理总结

    2023-06-29 05:48:40
  • 一文详解Python中多进程和进程池的使用方法

    2023-12-01 04:10:12
  • Python设计模式之组合模式原理与用法实例分析

    2023-04-12 16:15:28
  • Python中使用 Selenium 实现网页截图实例

    2022-07-04 06:28:16
  • pd.read_csv读取文件路径出现的问题解决

    2022-03-16 06:12:53
  • 解决Python logging模块无法正常输出日志的问题

    2023-10-03 17:04:25
  • SQL语句参考及记录集对象详解

    2008-11-25 11:47:00
  • 微软建议的ASP性能优化28条守则(3)

    2008-02-24 16:30:00
  • python中re.findall函数实例用法

    2021-03-28 07:51:20
  • asp之家 网络编程 m.aspxhome.com