加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Python爬取北京二手房数据,说明北漂族买得起房吗? | 附完备源码

发布时间:2018-08-23 01:46:53 所属栏目:教程 来源:徐麟
导读:技能沙龙 | 邀您于8月25日与国美/AWS/转转三位专家配合切磋小措施电商拭魅战 房价高是北漂们一向体谅的话题,本文就对北京的二手房数据举办了说明。 本文首要分为两部门:Python爬取赶集网北京二手房数据,R对爬取的二手房房价做线性回归说明,得当方才打仗Py

探讨Bedrooms与TotalPrice的相关

  1. table(DATA$Bedrooms) 
  2.   1    2    3    4    5    6    7    9  
  3. 541 1225  779  193  102   20    5    1  
  4. ##因为拥有6、7、9个寝室数的数目较少,这里我们倾轧这些数据。 
  5. DATA<-DATA[-(which(DATA$Bedrooms %in% "6")),] 
  6. DATA<-DATA[-(which(DATA$Bedrooms %in% "7")),] 
  7. DATA<-DATA[-(which(DATA$Bedrooms %in% "9")),] 
  8. table(DATA$Bedrooms) 
  9.    1    2    3    4    5  
  10.  541 1225  779  193  102  
  11.  
  12. library(ggplot2) 
  13. ggplot(DATA,aes(x=Bedrooms,y=TotalPrice))+geom_boxplot(col="red") 

Python爬取北京二手房数据,说明北漂族买得起房吗? | 附完备源码

  1. DATA$Bedrooms<-as.numeric(DATA$Bedrooms) 
  2. ##这里将寝室数为1、2、3定名为A,4为B,5为C 
  3. DATA$Bedrooms[DATA$Bedrooms=='1']<-"A" 
  4. DATA$Bedrooms[DATA$Bedrooms=='2']<-"A" 
  5. DATA$Bedrooms[DATA$Bedrooms=='3']<-"A" 
  6. DATA$Bedrooms[DATA$Bedrooms=='4']<-"B" 
  7. DATA$Bedrooms[DATA$Bedrooms=='5']<-"C" 

差异寝室数,TotalPrice差异。且跟着寝室数的增多,总价越高,切合公共的认知。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读