一文详解数据科学家的必备手艺(附进修资源)
下图表现了这些说话、框架和其他数据科学软件器材的列表。 汗青比对 GlassDoor说明白2017年1月至2017年7月时代在其网站上的数据科学家最常见的10种软件手艺。以下是与2018年10月LinkedIn, Indeed, SimplyHired, 和Monster均匀程度对比,它们在网站上呈现频率的较量。 功效很是相似。我的说明和GlassDoor’s都发明Python、R和SQL是最受接待的。我们还发明白同样的前九位技能手艺,只是次序略有差异。 功效表白,与2017年上半年对比,今朝对R、Hadoop、Java、SAS和MATLAB需求较少,Tableau需求则更大。这就是我所祈望的,对 KDnuggets developer survey等来历的功效的增补。在哪里,R、Hadoop、Java和SAS都表现出明明的多年降落趋势,Tableau表现出明明的上升趋势。 提议 按照以上说明功效,为当前和有幻想的数据科学家,提出一些一样平常性的提议,以使本身在职场上更受接待: 1. 证明你可以举办数据说明,并专注于成为真正善于呆板进修的人。 2. 投资于本身的雷同能力。我提议阅读《Made to Stick》这本书,它对你的设法会有更大的影响。还可以查察名称为 Hemmingway Editor的APP(应用措施),以进步写作的清楚度。 《Made to Stick》:https://www.amazon.com/Made-Stick-Ideas-Survive-Others/dp/1400064287 Hemmingway Editor:http://www.hemingwayapp.com/ 3. 把握一个深度进修的框架。对深度进修框架的纯熟水平是能干呆板进修的重要构成部门。有关深度进修框架在用法、乐趣和风行水平方面的较量,请参阅下方链接中的文章: https://towardsdatascience.com/deep-learning-framework-power-scores-2018-23607ddf297a 4. 假如在进修Python和R之间举办选择,请选择Python。假如对Python不伤风,思量进修R。假如你会行使Python的同时也知道R,你必定会更有市场。 当店主正在探求一位具备Python手艺的数据科学家时,他们也祈望应聘者能相识常见的Python数据科学库,如:numpy、pandas、scikit-learn和matplotlib。假如想进修这组器材,我提议提供以下资源: 1. DataCamp和 DataQuest:它们都是订价公道的在线SaaS数据科学教诲产物,在这些产物中,您可以一边编写代码一边进修,二者都传授一些技能器材。 DataCamp https://www.datacamp.com/ DataQuest https://www.dataquest.io/ 2. Data School拥有多种资源,包罗一套很好的视频,表明数据科学的观念。 Data School https://www.dataschool.io/start/ 视频资源:https://www.youtube.com/dataschool 3. 麦金尼(McKinney)的《用于数据说明的Python》。这本书由pandas库的首要作者撰写,重点存眷pandas,还接头了根基的python,numpy和scikit-learn等数据科学的常识。 Python for Data Analysis https://www.amazon.com/Python-Data-Analysis-Wrangling-IPython/dp/1491957662 4. Müller&Guido的《用Python举办呆板进修简介》。米勒是scikit-learn的首要维护者。这是一本用于进修呆板进修scikit-learn的很好的书。 Introduction to Machine Leaning with Python https://www.amazon.com/Introduction-Machine-Learning-Python-Scientists-ebook/dp/B01M0LNE8C 假如你想探讨深度进修,我提议在进入TensorFlow或PyTorch之前先从Keras或FastAI开始。Chollet的《用Python举办的深度进修》一书是进修Keras的很好的资源。除了这些提议之外,我提议你相识本身感乐趣的内容,尽量在抉择怎样分派进修时刻时有许多身分必要思量。 假如你想通过收集派别探求一份数据科学家的事变,我提议你从LinkedIn开始——它的功效老是最多的。 假如你在网上求职可能在求职网站上宣布地位,要害词很是重要。“数据科学”返回的功效是“数据科学家”返回功效数的近3倍。可是,假如你在严酷地探求数据科学家的事变,你最好照旧输入 “数据科学家”这个要害字。 无论你在哪个网站谋事变,我提议你成立一个在线组合列表,列出你对所需求手艺规模的纯熟水平。我还提议用LinkedIn小我私人资料展示你的手艺。 作为这个项目标一部门,我网络了其他数据,也许也会写成文章。跟我来,不要错过哦。 假如您但愿看到交互式图表和它们背后的代码,请查察我的Kaggle Kernel: Kaggle Kernel:https://www.kaggle.com/discdiver/the-most-in-demand-skills-for-data-scientists/ 作者简介: Jeff Hale是一位履历富厚的企业家,曾为多家公司打点过技能、运营和财政。专注于呆板进修规模的数据科学家,子商务公司的配合首创人和首席运营官。今朝,杰夫正将他对数据驱动决定的热情转化为以数据科学家为职业期盼。他对呆板进修、交换和数据说明很感乐趣。
译者简介:陈之炎,北京交通大学通讯与节制工程专业结业,得到工学硕士学位,历任长城计较机软件与体系公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技能支持。今朝从事智能化翻译解说体系的运营和维护,在人工智能深度进修和天然说话处理赏罚(NLP)方面蕴蓄有必然的履历。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |