副问题[/!--empirenews.page--]
合几大常用的Python数据说明包,团结itchat的手段实现伴侣圈的说明。
从那边做起
微信此刻越来越融入到了我们每小我私人的糊口,从简朴的谈天器材到衣食住行的处事,再到撒播着富厚多彩信息的自媒体和涵盖万物的小措施,微信俨然就是一个小的生态体系。而人,是整个微信生态的焦点,每小我私纪忾侣圈就是自我小生态的焦点。itchat为我们提供了获取伴侣信息的接口:
- friends=itchat.get_friends(update=True)[0:]
通过debug可以看到每个friend的信息:
可以看到每个挚友的信息照旧很富厚的,从昵称、性别、到区域等,挚友列表凭证通信录分列,第一个是用户本身,接着是星标置顶的挚友,好比瑾瑾在我的列内外排第一位。我们本日全部的事变都将从挚友的信息做起。
统计挚友性别漫衍
性别漫衍是最轻易统计的数据,通过查察我本身和几个挚友的数据,得出sex和性此外对应相关为:
- sex = 0: 未知sex = 1: 男生sex = 2: 女生
- pyecharts 是一个用于天生 Echarts 图表的类库,而Echarts 是百度开源的一个数据可视化 JS 库。首要用于数据可视化。操作pyecharts画出挚友性别漫衍:
- from pyecharts import Pie
- boy=girl=nothing=0
- for i in friends[1:]:
- sex =i[Sex]
- if sex==1:
- boy+=1
- elif sex==2:
- girl+=1
- else:
- nothing+=1
- total=len(friends[1:])
- attr=[迷妹,迷弟 , 低调的匿名粉丝]
- v1 = [boy,girl, nothing]
- pie = Pie(粉丝性别漫衍, title_pos='center')
- pie.add(, attr, v1, radius=[40, 75], label_text_color=None,is_label_show=True,is_legend_show=False)
- pie.show_config()pie.render(./sex_data.html)
运行功效如下:
没想到我的微信上的迷妹竟然比迷弟都多了这么多,其实是吃鲸,还但愿瑾瑾不要打我。
挚友区域漫衍
说明完挚友的性别我们再来说明挚友的区域漫衍,看看本身的挚友是不是遍布不着边际:
- from pyecharts import Map
- import pandas as pd
- def get_var(var):
- variable=[]
- for i in friends:
- value=i[var]
- variable.append(value)
- return
- variableNickName=get_var(NickName)
- Sex=get_var(Sex)
- Province=get_var('Province')
- Signature=get_var('Signature')
- city=get_var('City')
- data{'NickName':NickName,'Sex':Sex,'Province':Province,'Signature':Signature,'city':city}
- frame=pd.DataFrame(data)
- result1=frame.groupby(['Province'],as_index=False).size()a1=list(result1)
- a2=result1.indexmap=Map(我的挚友占了泰半此中国啊!, 来自微信的伴侣圈, title_pos=center,width=1200, height=600)map.add(, a2, a1, maptype='china', is_visualmap=True, visual_text_color='#000',visual_range=[1, 8], is_label_show=True, symbol=diamon, label_pos=inside )
- map.show_config()
- map.render(./area_data.HTML)
最后的功效如下:
很是地准,作为一个飘过北、上、杭的“浪里白条”,除了田园河南,我的挚友根基齐集在上海、北京和杭州,什么时辰也可以到广深溜一波。
挚友本性署名词云说明
微信署名是相识一小我私人性格和立场的重要参考,想看看我的伴侣圈里的大神们都是走的文艺风,照旧小清爽,照旧大学霸… …话不多说,一试便知:jieba(结巴)是一个强盛的分词库,美满支持中文分词;wordcloud是一个基于Python的词云天生类库,很好用;matplotlib.pyplot是一些呼吁行气魄威风凛凛函数的荟萃,使matplotlib以相同于MATLAB的方法事变。每个pyplot函数对一幅图片(figure)做一些窜改:好比建设新图片,在图片建设一个新的作图地区(plotting area),在一个作图地区内画直线,给图添加标签(label)等:
- import reimport jieba
- import wordcloud as wc
- import numpy as np
- import PIL.Image as Imageimport matplotlib.pyplot as pltsig
- list=[]
- for i in friends:
- signature=i['Signature'].strip().replace(span,).replace(class,).replace(emoji,)
- rep=re.compile(1fd+w*|[/=])
- signature=rep.sub(,signature)
- siglist.append(signature)
- text=.join(siglist)
- wordlist=jieba.cut(text,cut_all=True)
- word_space_split= .join(wordlist)
- coloring= np.array(Image.open(./1.jpg)) # 一张猴子图片,试了许多照片,照旧这个好
(编辑:湖南网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|