加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

用数据说明收集暴力有多可骇

发布时间:2019-04-02 10:04:26 所属栏目:教程 来源:小F
导读:这应该是一篇拖得蛮久的文章。 故事源于潘长江在某个综艺节目上没认出蔡徐坤,然后潘长江先生的微博评述区就炸锅了。 最后搞得双方都多几几何受到收集暴力的影响。 直至今天,这条微博的评述区还在更新着。 不得不说微博的黑粉,强行带节拍,真的很可骇。

06 评述词云

用数据说明收集暴力有多可骇

概略上谈吐还算好,没有很过火。

可视化代码如下。

  1. from wordcloud import WordCloud, ImageColorGenerator 
  2. import matplotlib.pyplot as plt 
  3. import jieba 
  4.  
  5.  
  6. def create_wordcloud(df): 
  7.     """ 
  8.     天生评述词云 
  9.     """ 
  10.     words = pd.read_csv('chineseStopWords.txt', encoding='gbk', sep='t', names=['stopword']) 
  11.     # 分词 
  12.     text = '' 
  13.     for line in df['comment']: 
  14.         line = line.split(':')[-1] 
  15.         text += ' '.join(jieba.cut(str(line), cut_all=False)) 
  16.     # 停用词 
  17.     stopwords = set('') 
  18.     stopwords.update(words['stopword']) 
  19.     backgroud_Image = plt.imread('article.jpg') 
  20.     wc = WordCloud( 
  21.         background_color='white', 
  22.         mask=backgroud_Image, 
  23.         font_path='C:WindowsFonts华康俪金黑W8.TTF', 
  24.         max_words=2000, 
  25.         max_font_size=150, 
  26.         min_font_size=15, 
  27.         prefer_horizontal=1, 
  28.         random_state=50, 
  29.         stopwords=stopwords 
  30.     ) 
  31.     wc.generate_from_text(text) 
  32.     img_colors = ImageColorGenerator(backgroud_Image) 
  33.     wc.recolor(color_func=img_colors) 
  34.     # 高词频词语 
  35.     process_word = WordCloud.process_text(wc, text) 
  36.     sort = sorted(process_word.items(), key=lambda e: e[1], reverse=True) 
  37.     print(sort[:50]) 
  38.     plt.imshow(wc) 
  39.     plt.axis('off') 
  40.     wc.to_file("微博评述词云.jpg") 
  41.     print('天生词云乐成!') 

五、总结

最后,照例来扒一扒哪位用户评述最多。

用数据说明收集暴力有多可骇

这位男性用户,一共评述了90条,居于首位。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读