python语言中pandas字符串分割str.split()函数

作者:hanyunkaka 时间:2022-01-30 16:55:56 

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期对手比分时间投篮...
05/17鹈鹕110-98(胜)2711-22...
05/16步行者122-115(胜)2811-22...
..................

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0命中数投篮数
11122
21122
.........

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

来源:https://blog.csdn.net/hanyunkaka/article/details/120586261

标签:pandas,str.split(),函数
0
投稿

猜你喜欢

  • pygame游戏之旅 按钮上添加文字的方法

    2022-09-28 23:41:39
  • em和strong的区别

    2008-12-23 12:08:00
  • 识别操作系统是不是vista的js代码

    2013-10-20 19:08:25
  • 基于python分析你的上网行为 看看你平时上网都在干嘛

    2021-09-02 15:04:39
  • python 异常的传递性及主动抛出学习

    2021-03-19 05:02:38
  • Django之第三方平台QQ授权登录的实现

    2023-04-27 16:37:06
  • Python实现图片与视频互转代码实战(亲测有效)

    2021-05-30 17:21:03
  • 详解Flask前后端分离项目案例

    2022-03-16 02:43:51
  • Python通过wordcloud库实现将单词生成词云

    2022-02-24 20:17:18
  • PyGame实现初始化导入所有模块方法详解

    2023-05-25 15:14:55
  • 基于Python实现体育彩票选号器功能代码实例

    2021-06-15 17:48:54
  • python3.5 email实现发送邮件功能

    2023-06-14 15:58:59
  • python的json中方法及jsonpath模块用法分析

    2021-10-06 08:21:32
  • Python设计模式之状态模式原理与用法详解

    2022-04-16 06:37:36
  • Python操作sqlite3快速、安全插入数据(防注入)的实例

    2022-04-22 16:38:14
  • Python使用Requests请求网页方式

    2022-10-08 06:01:09
  • python基础练习之几个简单的游戏

    2023-06-27 14:22:18
  • taobao cdn的缓存?

    2009-09-19 17:21:00
  • PHP自带函数给数字或字符串自动补齐位数

    2023-07-19 01:09:55
  • 几个关于python Pdf 技巧的分享

    2021-11-30 11:39:58
  • asp之家 网络编程 m.aspxhome.com