数据分析与可视化:谁是安全圈的吃鸡第一人
先用环形相关图看看: 圆上的每个红点代表一位玩家,无数条灰边则将列位玩家串联起来。在这份数据齐集一共有1270个节点,他们相互构成了共计14216次挚友相关,形成了7128条灰边。称得上是伟大的交际收集了。 我们行使无向图来构建力引导相关,固然在安详规模的风控、反诓骗偏向中行使有向图更为普及一些,但挚友相关是双向的,因此这里用无向图。代码如下:
获得: 俗话说“物以类聚人以群分”,在我们的数据齐集也同样合用。可以调查到这份交际收集着实是由多个小社区群落构成的,好比在最左下角的这个部门,这个小社区处于安详圈的边沿地带,很有也许不是安详从颐魅者,我们放大来看: 这个“五边形”是一个完全子图。在这个小社区中,五小我私人都互为挚友,也被称作“派系(Clique)”,这五小我私人很有也许常常一路开黑。 同时我们可以看到极点这位玩家: 假如我们把上面最大的部门看做是安详圈的话,这位叫Feng_Bao的玩家卡在了安详圈与这个5人小社区“阶梯咽喉”的位置,这样的节点具有较高的“中介中心性(Betweenness Centrality)”,每每具有不行更换的浸染。在实际中相同衡宇中介一样,买房者与卖房者之间的接洽都得靠他。 除了中介中心性,在图论中节点尚有其它两个重要性子:度中心性(Degree Centrality)以及细密中心性(Closeness Centrality)。 一个节点与之相连的边越多,这个节点的度中心性就越高,也就是挚友越多,度中心性越高,很也许是具有较高光荣的人,好比微博的大V,意见首脑等。 细密中心性则是权衡一个节点到其他全部节点的最短间隔之和的指标,一个节点的细密中心性越高那么他撒播信息的时辰也就越不必要依靠其他人。 别离计较一下数据齐集三此中心性排名靠前的玩家。 有没有看到眼熟的ID呢: 确实看到一些眼熟的ID,但因为我们前面探求安详圈的算法并禁绝确,在网络数据的进程中很也许误入到某些特定的圈子中。好比某些安详圈玩家同时又是二次元喜爱者,那么很也许会把这份数据集带入到”二次元圈“。为了只管停止这种环境,我们行使一些社区发明算法来完成社区的探求与支解。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |