7个Python特殊技巧,助力你的数据分析工作之路
副问题[/!--empirenews.page--]
本文罗列了一些晋升或加快一般数据说明事变的能力,包罗:
1. Pandas Profiling 该器材结果明明。下图展示了挪用 df.profile_report() 这一简朴要领的功效: 行使该器材只需安装和导入 Pandas Profiling 包。 本文不再详述这一器材,如欲相识更多,请阅读: https://towardsdatascience.com/exploring-your-data-with-just-1-line-of-python-4b35ce21a82d 2. 行使 Cufflinks 和 Plotly 绘制 Pandas 数据 「履历富厚的」数据科学家或数据说明师大多对 matplotlib 和 pandas 很认识。也就是说,你只需挪用 .plot() 要领,即可快速绘制简朴的 pd.DataFrame 或 pd.Series: 有点无聊? 这已经很好了,不外是否可以绘制一个交互式、可缩放、可扩展的全景图呢?是时辰让 Cufflinks* *出马了!(Cufflinks 基于 Plotly 做了进一步的包装。) 在情形中安装 Cufflinks,只需在终端中运行! pip install cufflinks --upgrade 即可。查察下图: 结果许多几何了! 留意,上图独一改变的是 Cufflinks cf.go_offline() 的导入和配置,它将 .plot() 要领变为 .iplot()。 其他要领如 .scatter_matrix() 也可以提供很是棒的可视化功效: 必要做大量数据可视化事变的伴侣,可以阅读 Cufflinks 和 Plotly 的文档,发明更多要领。
3. IPython 把戏呼吁 IPython 的「把戏」是 IPython 基于 Python 尺度语法的一系列晋升。把戏呼吁包罗两种要领:行把戏呼吁(line magics):以 % 为前缀,在单个输入行上运行;单位格把戏呼吁(cell magics):以 %% 为前缀,在多个输入行上运行。下面罗列了 IPython 把戏呼吁提供的一些有效成果: (1) %lsmagic:找出所有呼吁 假如你只记得一个把戏呼吁,那必需得是这一个。执行 %lsmagic 呼吁将提供全部可用把戏呼吁的列表: (2) %debug:交互式 debug 这也许是我最常行使的把戏呼吁了。 大部门数据科学家都碰着过这种环境:执行的代码块一向 break,你绝望地写了 20 个 print() 语句,想输出每个变量的内容。然后,当你最终修复题目后,你还得返回并再次删除全部 print() 语句。 不外往后再也不消这样了。碰着题目后只需执行 %debug 呼吁,即可执行想要运行的恣意代码部门: 上图中产生了什么?
这对付更伟大的函数很是有效。 (3) %store:在 notebook 之间转达变量 这个呼吁也很酷。假设你花了一些时刻洗濯 notebook 中的数据,此刻你想在另一个 notebook 中测试一些成果,那么你是在统一个 notebook 中实现该成果,照旧生涯数据并在另一个 notebook 中加载数据呢?行使%store 呼吁后,这些操纵都不必要!该呼吁将存储变量,你可以在其他恣意 notebook 中检索该变量:
%who:列出全部全局变量。 你是否碰着过,为变量赋值后却健忘变量名的环境?可能不警惕删掉了认真为变量赋值的单位格?行使%who 呼吁,你可以获得全部全局变量的列表: %%time:计时邪术呼吁 行使该呼吁可以获取全部计时信息。只需对恣意可执行代码应用%%time 呼吁,你就可以获得如下输出: %%writefile:向文件写入单位格内容 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |