加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

Python数据科学家的学习路径

发布时间:2020-03-26 07:05:03 所属栏目:移动互联 来源:站长网
导读:若是你想成为一个数据科学家,可能已经是数据科学家的你想扩展你的手艺,那么你已经来对处所了。本文的目标就是给数据说明方面的Python新手提供一个完备的进修路径。该路径提供了你必要进修的操作Python举办数据说明的全部步调的完备概述。假如你已经有一

若是你想成为一个数据科学家,可能已经是数据科学家的你想扩展你的手艺,那么你已经来对处所了。本文的目标就是给数据说明方面的Python新手提供一个完备的进修路径。该路径提供了你必要进修的操作Python举办数据说明的全部步调的完备概述。假如你已经有一些相干的配景常识,可能你不必要路径中的全部内容,你可以随意调解你本身的进修路径,而且让各人知道你是怎样调解的。

Python数据科学家的进修路径

步调0:热身

开始进修路程之前,先答复第一个题目:为什么行使Python?可能,Python怎样施展浸染?

寓目DataRobot首创人Jeremy在PyCon Ukraine 2014上的30分钟演讲,来相识Python是何等的有效。

步调1:配置你的呆板情形

此刻你已经刻意要好勤进修了,也是时辰配置你的呆板情形了。最简朴的要领就是从上下载分发包Anaconda。Anaconda将你往后也许会用到的大部门的对象举办了打包。回收这个要领的首要弱点是,纵然也许已经有了可用的底层库的更新,你如故必要守候Continuum去更新Anaconda包。虽然假如你是一个初学者,这应该没什么题目。

步调2:进修Python说话的基本常识

你应该先去相识Python说话的基本常识、库和数据布局。Codecademy上的Python课程是你最好的选择之一。完成这个课程后,你就能轻松的操作Python写一些小剧本,同时也能领略Python中的类和工具。

详细进修内容:列表Lists,元组Tuples,字典Dictionaries,列表推导式,字典推导式。

使命:办理HackerRank上的一些Python教程题,这些题能让你更好的用Python剧本的方法去思索题目。

更换资源:假如你不喜好交互编码这种进修方法,你也可以进修谷歌的Python课程。这个2天的课程系列不单包括前边提到的Python常识,还包括了一些后边将要接头的对象。

步调3:进修Python说话中的正则表达式

你会常常用到正则表达式来举办数据整理,尤其是当你处理赏罚文本数据的时辰。进批改则表达式的最好要领是介入谷歌的Python课程,它会让你能更轻易的行使正则表达式。

步调4:进修Python中的科学库—NumPy, SciPy, Matplotlib以及Pandas

从这步开始,进修路程将要变得风趣了。下边是对各个库的简介,你可以举办一些常用的操纵:

按照NumPy教程举办完备的操练,出格要操练数组arrays。这将会为下边的进修路程打好基本。

接下来进修Scipy教程。看完Scipy先容和基本常识后,你可以按照本身的必要进修剩余的内容。

这里并不必要进修Matplotlib教程。对付我们这里的需求来说,Matplotlib的内容过于普及。今朝只必要简朴相识一些就可以了。

最后进修Pandas。Pandas为Python提供DataFrame成果(相同于R)。这也是你应该花更多的时刻操练的处所。Pandas会成为全部中等局限数据说明的最有用的器材。

您还可以进修两篇博客Exploratory Data Analysis with Pandas和Data munging with Pandas中的内容。

特殊资源:

假如你必要一本关于Pandas和Numpy的书,提议Wes McKinney写的“Python for Data Analysis”。

步调5:有效的数据可视化

介入哈佛CS109的这个课程。你可以跳过前边的2分钟,但之后的内容都是干货。你可以按照这个使命来完成课程的进修。

步调6:进修Scikit-learn库和呆板进修的内容

此刻,我们要开始进修整个进程的实质部门了。Scikit-learn是呆板进修规模最有效的Python库。这里是该库的扼要概述。完成哈佛CS109课程的课程10到课程18,这些课程包括了呆板进修的概述,同时先容了像回归、决定树、整体模子等监视算法以及聚类等非监视算法。你可以按照各个课程的使命来完成响应的课程。

特殊资源:

假如说有那么一本书是你必读的,保举Programming Collective Intelligence。这本书固然有点老,但依然是该规模最好的书之一。

另外,你还可以介入来自Yaser Abu-Mostafa的呆板进修课程,这是最好的呆板进修课程之一。假如你必要更易懂的呆板进修技能的表明,你可以选择来自Andrew Ng的呆板进修课程,而且操作Python做相干的课程操练。

步调7:操练,操练,再操练

恭喜你,你已经完成了整个进修路程。

你此刻已经学会了你必要的全部手艺。此刻就是怎样操练的题目了,尚有比通过在Kaggle上和数据科学家们举办比赛来操练更好的方法吗?深入一个当前Kaggle上正在举办的角逐,实行行使你已经学过的全部常识来完成这个角逐。

步调8:深度进修

此刻你已经进修了大部门的呆板进修技能,是时辰存眷一下深度进修了。很也许你已经知道什么是深度进修,可是假如你如故必要一个简短的先容,可以看这里。

我本身也是深度进修的新手,以是请有选择性的采用下边的一些提议。deeplearning.net上有深度进修方面最全面的资源,在这里你会发明全部你想要的对象—讲座、数据集、挑衅、教程等。你也可以实行介入Geoff Hinton的课程,来相识神经收集的根基常识。

附言:这篇文章固然是2015年的,可是对付刚入门python,同时想学数据科学的同窗照旧很有参考代价的。并且点开原文后,作者有在开头更新了一版2019年进修路径,有乐趣的也可以去看看。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读