加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

说明白一万多条拼车数据,看看北上广深的列位都回哪过年

发布时间:2019-02-01 23:53:58 所属栏目:教程 来源:ElliotBai
导读:目次 媒介 统计功效 爬虫思绪 统计思绪 跋文 媒介 很早之前发过一篇关于某拼车平台爬虫的文章,由于事变较量忙,一向没有下文。最连年底轻微空了些,加上碰上春节返乡大潮,恰恰再拿过来写一下数据说明的思绪。 本次数据样本共13041条,本别收罗了北京、上

关于Mongodb数据库的毗连,直接上代码:

  1. client = MongoClient('mongodb://localhost:27017') 
  2. spring = client.spring 
  3. collection = spring['orders'] 

以上代码的意思就是毗连当地Mongodb-spring数据库-orders文档荟萃。

Pyecharts

Pyecharts(http://pyecharts.org)是台甫鼎鼎的Echarts的Python可视化图表库,用起来挺随手的,并且文档类型,根基上可以零门槛入门,详细实现请移步文档。

这里先容一下关于Pyecharts的图表样式设置,为了保持各图表的样式同一(偷懒),Pyecharts提供了一个Style类,可用于在统一个图可能多个图内保持同一的气魄威风凛凛。

  1. from pyecharts import Style,Geo 
  2.  
  3. style = Style( 
  4.    title_color="#fff", 
  5.    title_pos="center", 
  6.    width=1100, 
  7.    height=600, 
  8.    background_color='#404a59' 
  9. # style.init_style 会返回类初始化的气魄威风凛凛设置字典 
  10. geo = Geo("世界首要都市氛围质量", "data from pm2.5", **style.init_style) 

这样,就建设了一个Geo地理坐标系图表。

代码解读

由于所有代码有点长,以是抽了一段举个例子,首要思绪就是从Mongodb取出指定命据,可能通过$group管道对数据举办处理赏罚,最后通过pyecharts天生响应的图表,泛起:

  1. from pymongo import MongoClient 
  2. from pyecharts import Style,GeoLines 
  3.  
  4. def getLines(self): 
  5.    # 毗连数据库 
  6.    client = MongoClient('mongodb://localhost:27017') 
  7.    spring = self.client.spring 
  8.    collection = self.spring['orders'] 
  9.     
  10.    # Mongodb的操纵,$match-筛选出'from_poi.city.city_name'为'杭州'的文档, 
  11.    # 再通过$group管道,凭证方针都市统计出汇总数目 
  12.    line_hangzhou = collection.aggregate([ 
  13.        {'$match': {'from_poi.city.city_name': '杭州'}}, 
  14.        {'$group': {'_id': '$to_poi.city.city_name', 'count': {'$sum': 1}}} 
  15.    ]) 
  16.    # 凭证Geolines图表的数据名目名目化数据 
  17.    line_hangzhou_ = [] 
  18.    for line in line_hangzhou: 
  19.        line_hangzhou_.append(["杭州", line['_id'], line['count']]) 
  20.         
  21.    # 建设一个GeoLines图表 
  22.    citylines = GeoLines("春节迁徙蹊径图", **style.init_style) 
  23.    # 添加数据以及样式 
  24.    citylines.add("从杭州出发", 
  25.                  line_hangzhou_, 
  26.                  **geo_style) 
  27.    # 天生html文件 
  28.    citylines.render("results/citylines.html") 

跋文

这是一篇迟到好久的文章,原来没规划再写,可是总认为下半部门没写完内心有个结,以是照旧抽时刻补上。其它作为一个非专业技强职员,多记多练省得过几天本身就忘了。

【编辑保举】

  1. 消息联播也可以拿来做数据说明?
  2. 15分钟,教你用Python爬网站数据,并用BI可视化说明!
  3. 数据说明习用的5种思想要领
  4. 你乐意花异常钟辖档退解数据说明要领吗?
  5. 四种大数据说明要领与各人分享
【责任编辑:未丽燕 TEL:(010)68476606】
点赞 0

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读