焦点代码:
- # 洗濯数据,天生词云图
- def split_word(test_str):
- test_str = re.sub('[,,。. rn]', '', test_str)
- # jieba 词语
- segment = jieba.lcut(test_str)
- words_df = pd.DataFrame({'segment': segment})
- # quoting=3 暗示stopwords.txt里的内容所有不引用
- stopwords = pd.read_csv(r"H:PyCoding Analysis_wx_namestopwords.txt", index_col=False, quoting=3, sep="t", names=['stopword'], encoding='utf-8')
- words_df = words_df[~words_df.segment.isin(stopwords.stopword)]
- words_stat = words_df.groupby(by=['segment'])['segment'].agg({"计数": numpy.size})
- words_stat = words_stat.reset_index().sort_values(by=["计数"], ascending=False)
- test = words_stat.head(200).values
- codes = [test[i][0] for i in range(0,len(test))]
- counts = [test[i][1] for i in range(0,len(test))]
- wordcloud = WordCloud(width=1300, height=620)
- wordcloud.add("微信昵称", codes, counts, word_size_range=[20, 100])
- wordcloud.render('render_03.html')
运行结果:

pyecharts词云图
4. 行使Wordcloud+matplotlib,天生高级一点的词云图:
焦点代码:
- # 下下期好好讲一下matplotlib画图可视化,挺故意思的
- # 挪用get_name函数获取所有微信名
- text = get_name()
- # 挪用jiebaclearText函数,洗濯数据(该函数和上面切词头脑一样)
- text1=jiebaclearText(text)
- #发生词云图
- bg = plt.imread(r"G:small_pig.jpg")
- #天生词云
- wc=WordCloud(
- background_color="wathet", #配置配景为白色,默以为玄色
- mask=bg, # 配置词云内容范畴(除指定图片白色地区的其他地区都将包围词云内容)
- margin=10, #配置图片的边沿
- max_font_size=70, #表现的最大的字体巨细
- random_state=20, #为每个单词返回一个PIL颜色
- font_path='G:simkai.ttf' #中文处理赏罚,用体系自带的字体
- # 可以在这里下载这个字体:http://www.font5.com.cn/font_download.php?id=534&part=1245067666
- ).generate(text1)
- #为图片配置字体
- my_font=fm.FontProperties(fname='G:simkai.ttf')
- # 图片配景
- bg_color = ImageColorGenerator(bg)
- # 开始绘图
- plt.imshow(wc.recolor(color_func=bg_color))
- # 为云图去掉坐标轴
- plt.axis("off")
- # 生涯云图
- wc.to_file("render_04.png")
5.词云外观原图:

这是您的专属社会人
运行结果:

wordcloud词云图
因为第二种要领无法理会心情图,以是没有意情呈现,除此之外,这两种要领表现的词云图内容,险些大同小异。
通过词云图,我们一眼看出,各人行使最多的,除开中文后,就是心情图了,你的微信伴侣圈里,是否也有这样的大红嘴唇,我的仿佛有,哈哈哈~ (编辑:湖南网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|