加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文详解数据科学家的必备手艺(附进修资源)

发布时间:2019-01-18 02:45:36 所属栏目:教程 来源:陈之炎翻译
导读:数据科学家必要涉猎的常识面很广,包罗:呆板进修、计较机科学、统计学、数学、数据可视化、雷同和深度进修,那么数据科学家应怎样拟定他们的进修预算,才气最大限度地满意店主的必要? 我赏识了一些求职网站,想找出哪些手艺是数据科学家最必要把握的手艺

下图表现了这些说话、框架和其他数据科学软件器材的列表。

一文详解数据科学家的必备手艺(附进修资源)

汗青比对

GlassDoor说明白2017年1月至2017年7月时代在其网站上的数据科学家最常见的10种软件手艺。以下是与2018年10月LinkedIn, Indeed, SimplyHired, 和Monster均匀程度对比,它们在网站上呈现频率的较量。

功效很是相似。我的说明和GlassDoor’s都发明Python、R和SQL是最受接待的。我们还发明白同样的前九位技能手艺,只是次序略有差异。

功效表白,与2017年上半年对比,今朝对R、Hadoop、Java、SAS和MATLAB需求较少,Tableau需求则更大。这就是我所祈望的,对 KDnuggets developer survey等来历的功效的增补。在哪里,R、Hadoop、Java和SAS都表现出明明的多年降落趋势,Tableau表现出明明的上升趋势。

提议

按照以上说明功效,为当前和有幻想的数据科学家,提出一些一样平常性的提议,以使本身在职场上更受接待:

1. 证明你可以举办数据说明,并专注于成为真正善于呆板进修的人。

2. 投资于本身的雷同能力。我提议阅读《Made to Stick》这本书,它对你的设法会有更大的影响。还可以查察名称为 Hemmingway Editor的APP(应用措施),以进步写作的清楚度。

《Made to Stick》:https://www.amazon.com/Made-Stick-Ideas-Survive-Others/dp/1400064287

Hemmingway Editor:http://www.hemingwayapp.com/

3. 把握一个深度进修的框架。对深度进修框架的纯熟水平是能干呆板进修的重要构成部门。有关深度进修框架在用法、乐趣和风行水平方面的较量,请参阅下方链接中的文章:

https://towardsdatascience.com/deep-learning-framework-power-scores-2018-23607ddf297a

4. 假如在进修Python和R之间举办选择,请选择Python。假如对Python不伤风,思量进修R。假如你会行使Python的同时也知道R,你必定会更有市场。

当店主正在探求一位具备Python手艺的数据科学家时,他们也祈望应聘者能相识常见的Python数据科学库,如:numpy、pandas、scikit-learn和matplotlib。假如想进修这组器材,我提议提供以下资源:

1. DataCamp和 DataQuest:它们都是订价公道的在线SaaS数据科学教诲产物,在这些产物中,您可以一边编写代码一边进修,二者都传授一些技能器材。

DataCamp

https://www.datacamp.com/

DataQuest

https://www.dataquest.io/

2. Data School拥有多种资源,包罗一套很好的视频,表明数据科学的观念。

Data School

https://www.dataschool.io/start/

视频资源:https://www.youtube.com/dataschool

3. 麦金尼(McKinney)的《用于数据说明的Python》。这本书由pandas库的首要作者撰写,重点存眷pandas,还接头了根基的python,numpy和scikit-learn等数据科学的常识。

Python for Data Analysis

https://www.amazon.com/Python-Data-Analysis-Wrangling-IPython/dp/1491957662

4. Müller&Guido的《用Python举办呆板进修简介》。米勒是scikit-learn的首要维护者。这是一本用于进修呆板进修scikit-learn的很好的书。

Introduction to Machine Leaning with Python

https://www.amazon.com/Introduction-Machine-Learning-Python-Scientists-ebook/dp/B01M0LNE8C

假如你想探讨深度进修,我提议在进入TensorFlow或PyTorch之前先从Keras或FastAI开始。Chollet的《用Python举办的深度进修》一书是进修Keras的很好的资源。除了这些提议之外,我提议你相识本身感乐趣的内容,尽量在抉择怎样分派进修时刻时有许多身分必要思量。

假如你想通过收集派别探求一份数据科学家的事变,我提议你从LinkedIn开始——它的功效老是最多的。

假如你在网上求职可能在求职网站上宣布地位,要害词很是重要。“数据科学”返回的功效是“数据科学家”返回功效数的近3倍。可是,假如你在严酷地探求数据科学家的事变,你最好照旧输入 “数据科学家”这个要害字。

无论你在哪个网站谋事变,我提议你成立一个在线组合列表,列出你对所需求手艺规模的纯熟水平。我还提议用LinkedIn小我私人资料展示你的手艺。

作为这个项目标一部门,我网络了其他数据,也许也会写成文章。跟我来,不要错过哦。

假如您但愿看到交互式图表和它们背后的代码,请查察我的Kaggle Kernel:

Kaggle Kernel:https://www.kaggle.com/discdiver/the-most-in-demand-skills-for-data-scientists/

作者简介:

Jeff Hale是一位履历富厚的企业家,曾为多家公司打点过技能、运营和财政。专注于呆板进修规模的数据科学家,子商务公司的配合首创人和首席运营官。今朝,杰夫正将他对数据驱动决定的热情转化为以数据科学家为职业期盼。他对呆板进修、交换和数据说明很感乐趣。

  • 原文问题:The Most in Demand Skills for Data Scientists
  • 原文链接:https://www.kdnuggets.com/2018/11/most-demand-skills-data-scientists.html

译者简介:陈之炎,北京交通大学通讯与节制工程专业结业,得到工学硕士学位,历任长城计较机软件与体系公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技能支持。今朝从事智能化翻译解说体系的运营和维护,在人工智能深度进修和天然说话处理赏罚(NLP)方面蕴蓄有必然的履历。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读