Python数据挖掘中常用的五种AutoEDA 工具总结

作者:Python学习与数据挖掘 时间:2022-05-20 02:49:51 

我们能否使用一些自动化工具代替人来完成数据分析的过程呢,现有一些成熟的 AutoEDA 工具可以一定程度上完成上述过程。本文中,我将盘点常见的 AutoEDA 工具,欢迎收藏学习,喜欢点赞支持,文末提供技术交流群,欢迎畅聊。

1、Pandas Profiling

https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html

Pandas Profiling是款比较成熟的工具,可以直接传入DataFrame即可完成分析过程,将结果展示为HTML格式,同时分析功能也比较强大。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、重复行分析

  • 耗时:较少

Python数据挖掘中常用的五种AutoEDA 工具总结

2、AutoViz

https://github.com/AutoViML/AutoViz

AutoViz是款美观的数据分析工具,在进行可视化的同时将结果保存为图片格式。

  • 功能:相关性分析、数值变量箱线图、数值变量分布图

  • 耗时:较多

Python数据挖掘中常用的五种AutoEDA 工具总结

3、Dataprep

https://dataprep.ai/

Dataprep是款比较灵活也比较强大的工具,也是笔者最喜欢的。它可以指定列进行分析,同时也可以在Notebook中进行交互式分析。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。

  • 耗时:较多

Python数据挖掘中常用的五种AutoEDA 工具总结

4、SweetViz

https://github.com/fbdesignpro/sweetviz

SweetViz是款强大的数据分析工具,可以很好的分析训练集和测试集,以及目标标签与特征之间的关系。

  • 功能:数据集对比分析、字段类型分析、变量分布分析、目标变量分析

  • 耗时:中等

Python数据挖掘中常用的五种AutoEDA 工具总结

5、D-Tale

https://github.com/man-group/dtale

D-Tale是款功能最为强大的数据分析工具,对单变量的分析过程支持比较好。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。

  • 耗时:中等

Python数据挖掘中常用的五种AutoEDA 工具总结

技术交流

欢迎转载、收藏、有所收获点赞支持一下!

Python数据挖掘中常用的五种AutoEDA 工具总结

来源:https://blog.csdn.net/weixin_38037405/article/details/121410731

标签:Python,数据挖掘,AutoEDA,工具
0
投稿

猜你喜欢

  • python并发爬虫实用工具tomorrow实用解析

    2023-03-18 02:29:07
  • php返回相对时间(如:20分钟前,3天前)的方法

    2023-10-26 11:20:38
  • Python利用PyExecJS库执行JS函数的案例分析

    2022-10-26 08:53:19
  • python通过urllib2获取带有中文参数url内容的方法

    2022-07-26 10:35:58
  • PHP判断是否微信访问的方法示例

    2023-07-05 03:21:36
  • pycharm部署、配置anaconda环境的教程

    2022-08-23 11:50:54
  • 向MySQL数据库的表中录入数据的实用方法

    2008-12-17 16:24:00
  • golang中defer的关键特性示例详解

    2023-08-06 06:12:45
  • Python随机生成身份证号码及校验功能

    2023-03-20 08:30:47
  • Python中的类与类型示例详解

    2023-08-12 12:21:42
  • Pytorch搭建SRGAN平台提升图片超分辨率

    2022-10-03 14:02:01
  • Python基础知识之函数,类,模块

    2022-10-28 05:25:36
  • asp sql数据验证之特殊字符处理

    2008-02-24 16:35:00
  • PHP crypt()函数的用法讲解

    2023-06-13 03:08:05
  • SQL Select语句完整的执行顺序

    2008-09-28 21:22:00
  • 解决pyshp UnicodeDecodeError的问题

    2021-08-01 10:17:39
  • 网页特效文字之—银箔字

    2013-08-07 00:21:39
  • python format格式化和数字格式化

    2021-09-04 16:28:31
  • 使用Postman生成的okhttp代码依赖

    2023-06-12 22:34:12
  • 2008年Logo设计10大趋势

    2008-02-28 13:06:00
  • asp之家 网络编程 m.aspxhome.com