加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

怎样成为知乎大V?爬取张佳玮138w+关注者:数据可视化

发布时间:2017-12-21 15:11:19 所属栏目:建站 来源:鸟哥笔记
导读:副问题#e# 一、媒介 作为简书上第一篇文章,先先容下小配景,即为什么爬知乎第一大V张令郎的138w+存眷者信息? 着实之前也写过不少小爬虫,凭证网上各类教程实例去练手,“不行停止”的爬过妹子图、爬过豆瓣Top250 影戏等等;也基于自身的设法,在浙大 120

3、10w+大V

前文已多次提到10w+大V,那么这 190 人里到底都有谁呢?这里以存眷人数为权重,天生词云如下:

奈何成为知乎大V?爬取张佳玮138w+存眷者:数据可视化

各人上知乎的话应该也有存眷一些大V,很多名字应该并不生疏,好比马伯庸、念头在杭州、葛巾、朱炫、丁香大夫等等,虽然也会发明并不是全部大V都存眷了张令郎,哪怕他是知乎第一人,今朝已交出了 3026 个答复, 135 个知乎收录答复的傲人后果(听说也是豆瓣和虎扑第一人)。

4、栖身地漫衍

终于到了我最初开始这个项目时,最想获取的的信息了。固然因为爬取服从而筛选掉了 100 存眷以下的id共134w,数据量方面不如问题所示的那么多,略有遗憾,但其拭魅真的拿到4.1w+条较优质数据时,发明处理赏罚起来也并不轻易。

好比这里的栖身地信息,有乱填水星、火星、那美克星,也有填国度、省份、县市、街道名目纷歧的,尚有诸如老和山之类门外汉不大白的“哑谜”等等,数据之脏令人头疼,且纯文本的数据又不像数字类可以筛选、排序,还没想到好的方法应对。再者Echarts官网固然有不少可以套用的模板,但有许多处所的经纬度必要从头获取,这样就在数据处理赏罚和舆图上定位有两处困难必要办理。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读