加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

怎样成为知乎大V?爬取张佳玮138w+关注者:数据可视化

发布时间:2017-12-21 15:11:19 所属栏目:建站 来源:鸟哥笔记
导读:副问题#e# 一、媒介 作为简书上第一篇文章,先先容下小配景,即为什么爬知乎第一大V张令郎的138w+存眷者信息? 着实之前也写过不少小爬虫,凭证网上各类教程实例去练手,“不行停止”的爬过妹子图、爬过豆瓣Top250 影戏等等;也基于自身的设法,在浙大 120

6、认证信息

本来只知道博士可以提供信息获得认证,知乎也会给以其答复更好的表现途径,使其更轻易生长为大V,以此作为对高学历人群、优质用户的嘉奖。

此次抓取的100+存眷4.1w+条数据中有 208 条认证信息。除却各类专业的博士、博士后外,尚有 37 家公司、机构, 9 条医师, 11 条传授/讲师/研究员, 13 条CFA、CPA持证人或工程师、构筑师,以及副总裁、首创人、记者、状师、WCG2005- 2006 魔兽争霸项目天下冠军、职业自行车手、主持人、作家等等。看来照旧有不少可往后续去相识下优质用户的。

奈何成为知乎大V?爬取张佳玮138w+存眷者:数据可视化

7、优越答复者

除了认证信息外,优越答复者这是辨别某用户是否为优质用户,是否值得存眷的一个重要指标。包括张佳玮在内,共有 468 位优越答复者,涉及 257 个话题,共呈现 768 人次优越答复者标签。

奈何成为知乎大V?爬取张佳玮138w+存眷者:数据可视化

涉及的 257 话题词云

而全部优越答复者孝顺的答复和知乎收录答复环境如下:

奈何成为知乎大V?爬取张佳玮138w+存眷者:数据可视化

最右上角的即是张佳玮的孝顺环境,令人瞠乎其后。也有不罕用户孝顺了上千个答复,可以说长短常高产。但大部门用户答复数<1000,收录数<50。因此对此地区放大,可见:

奈何成为知乎大V?爬取张佳玮138w+存眷者:数据可视化

有不少数据收录答复为0,由于还不知道知乎优越答复者的评判尺度,以是此处还需进一步相识。其它这些数据点,对应的加上一些大V名字也许表现起来能好,但一向在探索,还不得方式。

三、小结

本项目是小我私人第一次百万级数据的爬取,虽然因为爬取服从方面必要改造,以是具体用户信息选择性的只爬了100+存眷人数共4.1w+的id。其它也是第一次数据可视化,从完全不懂Echarts的各类参数,硬刚设置项,到始末得到了上述还算能看的一些数据图,不少处所还需进一步进修、改造,以求得到更合乎要求的、抱负的、自界说的可视化图。

其它,除却上述数据外,尚有点赞数、感激数、保藏数、存眷数和被存眷数、署名、小我私人简介等等数据并未处理赏罚,但根基想要获取的图都获得了,算是完成了此项目,也学到了许多对象。

作者:Deserts_X  中国统计网(ID:cntongji) 

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读