怎样成为知乎大V?爬取张佳玮138w+关注者:数据可视化
6、认证信息 本来只知道博士可以提供信息获得认证,知乎也会给以其答复更好的表现途径,使其更轻易生长为大V,以此作为对高学历人群、优质用户的嘉奖。 此次抓取的100+存眷4.1w+条数据中有 208 条认证信息。除却各类专业的博士、博士后外,尚有 37 家公司、机构, 9 条医师, 11 条传授/讲师/研究员, 13 条CFA、CPA持证人或工程师、构筑师,以及副总裁、首创人、记者、状师、WCG2005- 2006 魔兽争霸项目天下冠军、职业自行车手、主持人、作家等等。看来照旧有不少可往后续去相识下优质用户的。 7、优越答复者 除了认证信息外,优越答复者这是辨别某用户是否为优质用户,是否值得存眷的一个重要指标。包括张佳玮在内,共有 468 位优越答复者,涉及 257 个话题,共呈现 768 人次优越答复者标签。 涉及的 257 话题词云 而全部优越答复者孝顺的答复和知乎收录答复环境如下: 最右上角的即是张佳玮的孝顺环境,令人瞠乎其后。也有不罕用户孝顺了上千个答复,可以说长短常高产。但大部门用户答复数<1000,收录数<50。因此对此地区放大,可见: 有不少数据收录答复为0,由于还不知道知乎优越答复者的评判尺度,以是此处还需进一步相识。其它这些数据点,对应的加上一些大V名字也许表现起来能好,但一向在探索,还不得方式。 三、小结 本项目是小我私人第一次百万级数据的爬取,虽然因为爬取服从方面必要改造,以是具体用户信息选择性的只爬了100+存眷人数共4.1w+的id。其它也是第一次数据可视化,从完全不懂Echarts的各类参数,硬刚设置项,到始末得到了上述还算能看的一些数据图,不少处所还需进一步进修、改造,以求得到更合乎要求的、抱负的、自界说的可视化图。 其它,除却上述数据外,尚有点赞数、感激数、保藏数、存眷数和被存眷数、署名、小我私人简介等等数据并未处理赏罚,但根基想要获取的图都获得了,算是完成了此项目,也学到了许多对象。 作者:Deserts_X 中国统计网(ID:cntongji) (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |