Python数据挖掘中常用的五种AutoEDA 工具总结

作者:Python学习与数据挖掘 时间:2022-05-20 02:49:51 

我们能否使用一些自动化工具代替人来完成数据分析的过程呢,现有一些成熟的 AutoEDA 工具可以一定程度上完成上述过程。本文中,我将盘点常见的 AutoEDA 工具,欢迎收藏学习,喜欢点赞支持,文末提供技术交流群,欢迎畅聊。

1、Pandas Profiling

https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html

Pandas Profiling是款比较成熟的工具,可以直接传入DataFrame即可完成分析过程,将结果展示为HTML格式,同时分析功能也比较强大。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、重复行分析

  • 耗时:较少

Python数据挖掘中常用的五种AutoEDA 工具总结

2、AutoViz

https://github.com/AutoViML/AutoViz

AutoViz是款美观的数据分析工具,在进行可视化的同时将结果保存为图片格式。

  • 功能:相关性分析、数值变量箱线图、数值变量分布图

  • 耗时:较多

Python数据挖掘中常用的五种AutoEDA 工具总结

3、Dataprep

https://dataprep.ai/

Dataprep是款比较灵活也比较强大的工具,也是笔者最喜欢的。它可以指定列进行分析,同时也可以在Notebook中进行交互式分析。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。

  • 耗时:较多

Python数据挖掘中常用的五种AutoEDA 工具总结

4、SweetViz

https://github.com/fbdesignpro/sweetviz

SweetViz是款强大的数据分析工具,可以很好的分析训练集和测试集,以及目标标签与特征之间的关系。

  • 功能:数据集对比分析、字段类型分析、变量分布分析、目标变量分析

  • 耗时:中等

Python数据挖掘中常用的五种AutoEDA 工具总结

5、D-Tale

https://github.com/man-group/dtale

D-Tale是款功能最为强大的数据分析工具,对单变量的分析过程支持比较好。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。

  • 耗时:中等

Python数据挖掘中常用的五种AutoEDA 工具总结

技术交流

欢迎转载、收藏、有所收获点赞支持一下!

Python数据挖掘中常用的五种AutoEDA 工具总结

来源:https://blog.csdn.net/weixin_38037405/article/details/121410731

标签:Python,数据挖掘,AutoEDA,工具
0
投稿

猜你喜欢

  • 一篇文章搞定Mysql日期时间函数

    2024-01-20 19:32:58
  • 仿QQ和MSN消息提示的效果代码

    2010-03-16 12:17:00
  • python按比例随机切分数据的实现

    2021-05-28 05:17:34
  • Vue.js directive自定义指令详解

    2024-05-28 15:46:18
  • vue项目持久化存储数据的实现代码

    2024-04-27 15:59:48
  • Python模拟鼠标点击实现方法(将通过实例自动化模拟在360浏览器中自动搜索python)

    2021-06-11 17:17:54
  • 永恒之蓝实战教程之Mac通过Metasploit攻击Server2008的详细过程

    2022-08-01 05:41:26
  • 优化Python代码使其加快作用域内的查找

    2021-09-25 06:40:13
  • javascript实现花样轮播效果

    2024-05-25 15:19:20
  • Python使用requests xpath 并开启多线程爬取西刺代理ip实例

    2023-05-01 23:36:51
  • 妙用Dreamweaver MX共享Word XP文件

    2010-09-05 21:17:00
  • 基于python2.7实现图形密码生成器的实例代码

    2021-01-21 15:20:50
  • 解决pycharm每次新建项目都要重新安装一些第三方库的问题

    2023-02-22 23:08:22
  • 在Python中使用CasperJS获取JS渲染生成的HTML内容的教程

    2021-07-01 14:41:42
  • Python中处理字符串之endswith()方法的使用简介

    2023-02-25 09:05:36
  • Python中Tkinter组件Menu的具体使用

    2023-09-11 12:46:26
  • jQuery入门之–属性(一)

    2009-07-12 15:29:00
  • PHP中isset()和unset()函数的用法小结

    2023-11-19 14:19:24
  • 解决Django cors跨域问题

    2021-07-02 08:42:36
  • git中cherry-pick命令的使用教程

    2023-02-11 00:33:57
  • asp之家 网络编程 m.aspxhome.com