加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Python数据科学:方差说明

发布时间:2018-12-18 20:02:58 所属栏目:教程 来源:小F
导读:之前已经先容的变量说明: ①相干说明:一个持续变量与一个持续变量间的相关。 ②双样本t检讨:一个二分分类变量与一个持续变量间的相关。 本次先容: 方差说明:一个多分类分类变量与一个持续变量间的相关。 个平分类个数大于两个,分类变量也可以有多个

输出功效。

Python数据科学:方差说明

可以看到教诲水平的F值为31.57,P值趋近于0,拒绝原假设,即教诲水平与均匀支出有明显差别。

性此外F值为0.48,P值为0.48,无法拒绝原假设,即性别与均匀支出无明显差别。

接下来思量有交互效应,代码如下。

  1. # 消除pandas输出省略号环境 
  2. pd.set_option('display.max_columns', 5) 
  3. # smf:最小二乘法,构建线性回归模子 
  4. anal = smf.ols('avg_exp ~ C(edu_class) + C(gender) + C(edu_class)*C(gender)', data=df).fit() 
  5. # anova_lm:多身分方差说明 
  6. print(sm.stats.anova_lm(anal)) 

输出功效。

Python数据科学:方差说明

这里可以看出,思量交互效应后,与教诲水平及性别对应的F值和P值都产生了细小的改变。

个中教诲水和善性此社交互项对均匀支出的影响也是明显的,F值为2.22,P值为0.09。

上面这个结论是书中所说的,那么明显性程度取的是0.1吗???

这算是我领略不了的一部门。

下面是带交互项的多元方差说明的回归系数,表格中全部数据都是以男性及研究生学历作为基准去比对。

  1. # 天生数据总览 
  2. print(anal.summary()) 

输出功效。

Python数据科学:方差说明

可以看出第一种教诲水平的女性较男性研究生,名誉卡斲丧的影响较明显,P值为0.05。

原假设为无差别,拒绝原假设。

那么这里的明显性程度取的也是0.1吗???

第二种教诲水平的女性较男性研究生,名誉卡斲丧的影响明显,P值为0.001。

第三种缺失,没有参数预计。

三、总结

这里总结一下各个检讨的原假设。

  • 单样本t检讨原假设:总体均值与假设的检讨值不存在明显差别(无差别)。
  • 双样本t检讨原假设:两个样本均值(二分变量下的均值)不存在明显差别(无差别)。
  • 方差说明原假设:多个样本均值(多分变量下的均值)不存在明显差别(无差别)。

声名原假设都是假设变量相关无明显差别。

【编辑保举】

  1. Gartner:有87%企业的BI和说明成熟度还很低
  2. 用Python说明统计必胜客餐厅
  3. 用Python说明白1w场吃鸡数据,原本吃鸡要这么玩!
  4. 我爬取说明美团网,原本北京上海Top10美食是它们
  5. 用Python说明“女神大会”,码农最想娶的女星竟然是......
【责任编辑:未丽燕 TEL:(010)68476606】
点赞 0

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读