python验证多组数据之间有无显著差异
作者:fff2zrx? 时间:2021-03-12 15:37:22
一、方差分析
1.单因素方差分析
通过箱线图可以人肉看出10组的订单量看起来差不多,为了更科学比较10组的订单量有无显著差异,我们可以利用方差分析
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
model = ols('orders~C(label)',data=need_data).fit()
anova_table = anova_lm(model, typ = 2)
print(anova_table)
结果显示,p值为0.62大于0.05,不能拒绝原假设,所以这10组的订单量分布没有显著差异。
二、卡方检验
如果是比较多组之间的非连续值指标是否存在差异呢?
如检查上面10组的男女比例是否存在显著差异
计算各组观察频数:
data2=data1.melt(id_vars=['性别'],value_name='观察频数')
data2.head()
计算总体的男女比例:
rate=(data2.groupby(['性别'])['观察频数'].sum()/data2.groupby(['性别'])['观察频数'].sum().sum()).reset_index()
rate.columns=['性别','rate']
rate
计算各组用户总数:
group_sum=data2.groupby(['组别'])['观察频数'].sum().reset_index()
group_sum.columns=['组别','组内用户数']
group_sum
计算卡方值:
import math
data3=pd.merge(data2,group_sum,on=['组别'],how='left')
data3=pd.merge(data3,rate,on=['性别'],how='left')
data3['期望频数']=data3['组内用户数']*data3['rate']
data3['卡方值']=data3.apply(lambda x: math.pow((x.期望频数-x.观察频数),2)/x.期望频数,axis=1)
data3.head()
本案例的自由度为(10-1)*(2-1)=9
,选取显著性水平为0.05,查卡方分布表得临界值为18.31
因为7.01<18.31,所以不能拒绝原假设,即各组的性别分布不存在显著性差异。
来源:https://fff2zrx.blog.csdn.net/article/details/119952745
标签:python,验证,多组数据,显著差异
0
投稿
猜你喜欢
关于Python作用域自学总结
2023-11-02 12:19:53
Django应用程序入口WSGIHandler源码解析
2021-07-09 04:33:22
简单仿LightBox效果
2008-09-19 21:35:00
Python编程图形库之Pillow使用方法讲解
2022-04-07 06:10:57
GO的range具体使用
2023-07-21 03:27:27
pytorch 如何使用batch训练lstm网络
2023-10-18 04:46:02
Python selenium页面加载慢超时的解决方案
2022-10-15 04:37:43
在Python的Flask框架下收发电子邮件的教程
2021-03-05 08:54:37
python制作websocket服务器实例分享
2023-02-20 00:00:29
深入了解Python在HDA中的应用
2023-08-02 06:59:47
python为图片和PDF去水印详解
2023-06-28 14:09:43
python uuid生成唯一id或str的最简单案例
2021-06-07 00:40:45
python使用tornado实现简单爬虫
2022-07-07 12:03:08
在ASP中按指定参数格式化显示时间的函数。
2010-05-27 12:29:00
PHP常用函数和常见疑难问题解答
2023-11-08 19:28:17
十行Python3代码实现把情书写到图片中
2023-10-15 22:03:44
ASP链接Mysql数据库 非DSN连接的方法
2009-03-09 18:24:00
Flask和Django框架中自定义模型类的表名、父类相关问题分析
2022-04-04 00:23:17
python开发一个解析protobuf文件的简单编译器
2021-08-11 12:01:22
MongoDB为用户设置访问权限
2023-07-16 06:03:52