加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

文本发掘说明《欢悦颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配

发布时间:2021-03-06 19:06:31 所属栏目:大数据 来源:网络整理
导读:? 传闻最近各人都在看《欢悦颂》,这部热剧里,女性可谓是绝对的主角,22楼5个女房客的互动仿佛把男性脚色们的风头都抢光了;可是热点剧中又老是不能缺了言情戏的隐瞒。以是,《欢悦颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配呢?照旧让文本发掘为你发表吧

文本发掘说明《欢悦颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配

?

传闻最近各人都在看《欢悦颂》,这部热剧里,女性可谓是绝对的主角,22楼5个女房客的互动仿佛把男性脚色们的风头都抢光了;可是热点剧中又老是不能缺了言情戏的隐瞒。以是,《欢悦颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配呢?照旧让文本发掘为你发表吧……


要领

要判定两小我私人的相关的亲近水平,可以从他们打仗的频率、交换的次数入手;反应到小说上,就是两小我私人呈此刻统一场景或统一变乱里的次数许多。因此在现实说明时,我们假设一个段落是一个场景,呈此刻这个段落里的人物,互相之间都是有相关的。基于这个假设,我们先对原著小说举办文天职词,再将每个段落里呈现的人物抓取出来,然后统计每组人物相关呈现的频数,以获得我们存眷的人物之间的相关收集。


上述说明思绪中蕴含的最要害的技能点就是文天职词。在本次说明中,我们行使R软件中的segmentCN函数来实现。R是一个开源软件,用于数据处理赏罚、统计说明和制图,由于可以免费下载和行使,以及包括了实现各类说明成果的措施包,被普及承认和行使。(要挪用segmentCN函数必要加载Rwordseg措施包和rJava措施包,个中Rwordseg措施包已经不能直接在R中通过install.packages直接安装,而是必要先下载到当地再在R中加载)。从加载措施包,到举办中文分词,再到起源抓取人物的措施如下图所示:


文本发掘说明《欢悦颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配

我们这次首要说明的人物包罗欢悦颂22层的5位女生——安迪、曲筱绡、樊胜美、邱莹莹和关雎尔,以及在电视剧中与5位女生有亲近情绪纠葛,且在宽大女性观众“换老公清单”里的5位男士——赵启平、魏渭、王柏川、谭宗明和包奕凡。

对付这10小我私人物,至多应该有45种(两两)人物相关,虽然大概也有人生压根没有交集的。为了更精确更完备地抓取每一个场景中的人物,我们思量到加上这是小我私人物的昵称,好比魏渭的昵称是“奇点”,假如不抓取这个名字,也许最后说明出来的功效就是安迪和魏渭从来没有爱过。

说明功效

最终我们凭证相关亲近水平排序,排在前三名,即相关最亲近的3组人物相关如下图所示:

文本发掘说明《欢悦颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配

安迪和曲筱绡在666个场景中同时呈现,站到“安迪x曲筱绡”cp的你们真是太6了!樊胜美和邱莹莹在611个场景中同时呈现,猜想二人或许是一向处于一个挖坑一个填的模式中吧。安迪和小包总同时呈此刻602个场景中,算是呈现频次最高的异性cp了,而安迪和奇点(安迪的第一任男伴侣魏渭)在小说原著中,配合呈现的场次为443次。以是安迪最后照旧和小包总在一路了?从我们的说明功效来看是这样的……为奇点点蜡1秒钟。

其它我们还将人物相关收集用更直观的收集相关图的情势揭示出来,如下图所示:


从图上来看,安迪俨然是人生赢家啊,左拥右抱不说,还攻克着辣么多小女人,的确羡煞旁人。反观奇点,人艰不拆,您老照旧早觅出路的好。好像第二女主非樊胜美莫属了,她既与各姐妹相关都异常亲近,也与王柏川相关不变,也是让各人异常欣慰。最值得存眷的是,暗撩魅赵大夫的关关,他俩的线呢?再仔细心细打量一番,照旧没找到,真检验眼神。

看到这里,各人也许会提出一个疑问,我们之前假设一个段落代表一个场景,但现实小说也许必要几个段落才气把一个场景讲完;凭证之前的假设,我们会一再统计一些人物相关,也会漏掉一些人物相关。因此我们对要领举办改造,插手一个段落跨度的参数,用于界说一个场景。在我们的说明中,设定这个参数便是3,即在第i段呈现的某小我私人物,除了和本段的其他人物有相关外,也和i+1段和i+2段呈现的人物有相关。举个简朴的例子,第i段抓取出的人物曲直筱绡和赵大夫, 在第i+1段抓取的人物是安迪和奇点,在第i+2段没有抓取到这10小我私人物中的任何一位,于是计曲筱绡和赵大夫、曲筱绡和安迪、曲筱绡和奇点、赵大夫和安迪、赵大夫和奇点的人物相关呈现一次。


凭证这种做法,最终我们获得相关亲近水平排在前三名的3组人物相关如下:


安迪x樊胜美cp击败了安迪和小包总的官配,笔者不禁叹息,百合大法好!

画出的人物相关收集如下图所示:

文本发掘说明《欢悦颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配

不管怎么看,安迪都是人生赢家啊,其他人可以洗洗睡了。奇点,把你跟安迪放得再近,好像也没多大用,哎。。。终于!换了一种算法,可以看到关关和赵大夫了,不外和奇点一样,然并卵。公然本剧照旧一部弘扬姐妹情的主旋律作品。

续改造偏向

本文在对人物相关的细密水平举办说明时,以为呈此刻几个段落内的人物,互相之间都是有相关的,但相关的细密水平会被以为是同等的;然而实际中在一个场景里,会有变乱首要人物和次要人物,他们之间的相关的细密水平显然是差异的。于是在将来的说明中,可以思量辨认人物在小说中呈现的位置,计较人物之间的间隔,辨认场景/变乱里的首要人物和次要人物,以及他们之间的亲疏水平,赋予差别化的权重,从而更精确地反应人物相关的细密水平。

另外,以我们此刻的说明功效,曲筱绡和樊胜美这对人物相关在小说中呈现的频次还略多于曲筱绡和赵大夫,但我不能下结论说曲筱绡跟“樊大姐”的副黄?跟她的“唐僧”还亲昵。这是因为我们没有说明人物之间的情绪相关造成的,因此在将来的说明中,还可以思量引入情绪说明。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读