加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

用Python说明白数千个微信昵称后,我们发明白这些纪律...

发布时间:2018-08-29 11:22:33 所属栏目:教程 来源:XksA
导读:一、媒介 这是一篇技能文,但又不是一篇技能文,本日分享的是,当笔者获取了微信小措施英文取名的3500多个微名誉户昵称、年数段后,说明获得下面功效。 二、Let's get it 1.根基信息获取 会见英文取名的用户根基信息接口,获取英文取名用户微信名(Nick nam

焦点代码:

  1. # 洗濯数据,天生词云图 
  2. def split_word(test_str): 
  3.     test_str = re.sub('[,,。. rn]', '', test_str) 
  4.     # jieba 词语 
  5.     segment = jieba.lcut(test_str) 
  6.     words_df = pd.DataFrame({'segment': segment}) 
  7.     # quoting=3 暗示stopwords.txt里的内容所有不引用 
  8.     stopwords = pd.read_csv(r"H:PyCoding Analysis_wx_namestopwords.txt", index_col=False, quoting=3, sep="t", names=['stopword'], encoding='utf-8') 
  9.     words_df = words_df[~words_df.segment.isin(stopwords.stopword)] 
  10.     words_stat = words_df.groupby(by=['segment'])['segment'].agg({"计数": numpy.size}) 
  11.     words_stat = words_stat.reset_index().sort_values(by=["计数"], ascending=False) 
  12.     test = words_stat.head(200).values 
  13.     codes = [test[i][0] for i in range(0,len(test))] 
  14.     counts = [test[i][1] for i in range(0,len(test))] 
  15.     wordcloud = WordCloud(width=1300, height=620) 
  16.     wordcloud.add("微信昵称", codes, counts, word_size_range=[20, 100]) 
  17.     wordcloud.render('render_03.html') 

运行结果:

用Python说明白数千个微信昵称后,我们发明白这些纪律...

pyecharts词云图

4. 行使Wordcloud+matplotlib,天生高级一点的词云图:

焦点代码:

  1. # 下下期好好讲一下matplotlib画图可视化,挺故意思的 
  2. # 挪用get_name函数获取所有微信名 
  3. text = get_name() 
  4. # 挪用jiebaclearText函数,洗濯数据(该函数和上面切词头脑一样) 
  5. text1=jiebaclearText(text) 
  6. #发生词云图 
  7. bg = plt.imread(r"G:small_pig.jpg") 
  8. #天生词云 
  9. wc=WordCloud( 
  10.     background_color="wathet", #配置配景为白色,默以为玄色 
  11.     mask=bg,      # 配置词云内容范畴(除指定图片白色地区的其他地区都将包围词云内容) 
  12.     margin=10,               #配置图片的边沿 
  13.     max_font_size=70,   #表现的最大的字体巨细 
  14.     random_state=20,    #为每个单词返回一个PIL颜色 
  15.     font_path='G:simkai.ttf'   #中文处理赏罚,用体系自带的字体 
  16.     # 可以在这里下载这个字体:http://www.font5.com.cn/font_download.php?id=534&part=1245067666 
  17.     ).generate(text1) 
  18. #为图片配置字体 
  19. my_font=fm.FontProperties(fname='G:simkai.ttf') 
  20. # 图片配景 
  21. bg_color = ImageColorGenerator(bg) 
  22. # 开始绘图 
  23. plt.imshow(wc.recolor(color_func=bg_color)) 
  24. # 为云图去掉坐标轴 
  25. plt.axis("off") 
  26. # 生涯云图 
  27. wc.to_file("render_04.png") 

5.词云外观原图:

用Python说明白数千个微信昵称后,我们发明白这些纪律...

这是您的专属社会人

运行结果:

用Python说明白数千个微信昵称后,我们发明白这些纪律...

wordcloud词云图

因为第二种要领无法理会心情图,以是没有意情呈现,除此之外,这两种要领表现的词云图内容,险些大同小异。

通过词云图,我们一眼看出,各人行使最多的,除开中文后,就是心情图了,你的微信伴侣圈里,是否也有这样的大红嘴唇,我的仿佛有,哈哈哈~

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读