python数据挖掘需要学的内容

作者:laozhang 时间:2021-02-26 00:54:13 

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

标签:python,数据挖掘
0
投稿

猜你喜欢

  • 总结一些js自定义的函数

    2024-04-19 10:43:54
  • python基于搜索引擎实现文章查重功能

    2022-01-21 19:25:50
  • python编程之requests在网络请求中添加cookies参数方法详解

    2023-07-03 00:48:23
  • Python产生一个数值范围内的不重复的随机数的实现方法

    2023-09-19 21:48:09
  • python的重要技能输入与输出字符串格式化使用详解

    2021-02-15 09:49:11
  • 在VS2019环境下使用Opencv调用GPU版本YOLOv4算法的详细过程

    2023-05-12 10:50:46
  • python爬虫请求头的使用

    2023-03-21 07:10:23
  • 解决import tensorflow as tf 出错的原因

    2023-06-26 23:53:21
  • 详解python中 os._exit() 和 sys.exit(), exit(0)和exit(1) 的用法和区别

    2023-11-20 14:14:52
  • 按钮的反馈

    2009-01-01 20:06:00
  • python--shutil移动文件到另一个路径的操作

    2022-05-15 05:43:25
  • 浅谈微信小程序之官方UI框架we-ui使用教程

    2024-04-16 09:52:43
  • mysql中的replace函数替换字符串问题

    2024-01-25 16:30:47
  • pampy超强的模式匹配工具的实现

    2023-03-05 23:05:07
  • python的setattr函数实例用法

    2023-08-17 18:49:59
  • python eval()函数使用详情

    2021-10-17 02:09:23
  • Python 语言实现六大查找算法

    2022-11-09 14:41:30
  • go语言 全局变量和局部变量实例

    2024-04-26 17:18:56
  • 10分钟教你用python动画演示深度优先算法搜寻逃出迷宫的路径

    2023-10-16 08:05:00
  • 详解如何基于Pyecharts绘制常见的直角坐标系图表

    2022-07-08 05:18:31
  • asp之家 网络编程 m.aspxhome.com