加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

干货 :送你12个关于数据科学学习的关键提示(附链接)

发布时间:2019-04-04 17:41:04 所属栏目:教程 来源:国相洁翻译
导读:小结: 数据科学家必要强盛的数学和编码手段,但雷同手段和其余软手艺也是走向乐成不行缺傲幽根基功。 按照Glassdoor在美国区的统计,数据科学家排名为2019年最诱人的事变。均匀基本人为为$108k,事变满足度为4.35★,加上被猜测有大量空白,这个功效一点都
副问题[/!--empirenews.page--]

小结: 数据科学家必要强盛的数学和编码手段,但雷同手段和其余软手艺也是走向乐成不行缺傲幽根基功。

干货 :送你12个关于数据科学进修的要害提醒(附链接)

按照Glassdoor在美国区的统计,“数据科学家”排名为2019年最诱人的事变。均匀基本人为为$108k,事变满足度为4.3–5★,加上被猜测有大量空白,这个功效一点都不令人受惊。

题目是,一小我私人该怎样修炼才气走上正轨并获告捷任这份事变的资格?

为了找到谜底,我们总结了大量文章里的提议,许多可以归纳为编码与数学上的硬手艺(hard skills)。但强盛的计较手段并不是所有。一名优越的数据科学家仍必要和相干营业职员举办有用雷同,这里便必要一些软手艺(soft skills)。

干货 :送你12个关于数据科学进修的要害提醒(附链接)

锻造你的教诲地基:3个要点

Drace Zhan作为 NYC Data Science Academy 的数据科学家,夸大了教诲基本的须要性,包罗编码基本和数学手段:

  • NYC Data Science Academy:https://nycdatascience.com/

R/Python + SQL。假如你没有编码手段,那你就必要大量的收集等其余规模的力气来增补这个缺陷。我见到过一些数据科学家,有的数学手段较量单薄,可能对相干规模短缺履历,但他们总有很强的编码手段。Python是很抱负,R正在变得有点落伍,最好两样兵器都带上。SQL对付数据说明师来说同样极其重要。

  • R/Python + SQL:https://www.techopedia.com/definition/3533/python

强盛的数学手段。对一些常用的理论有着较好的领略:generalized linear models(广义线性模子),decision tree(决定树),K-means(聚类说明)和statistical tests(假设检讨)。这好过手握大量模子乃至专业模子如递归神经收集(RNN),却仅仅是浅尝辄止。

  • decision tree:https://www.techopedia.com/definition/28634/decision-tree
  • K-means:https://www.techopedia.com/definition/32057/k-means-clustering

这些都是必要作育的焦点手艺,尽量一些专家还插手了其余对象。譬喻,一份 KDnuggests 清单包括了编码因素,Zhan在此基本上还插手了一些其他有效的对象,包罗Hadoop平台,Apache Spark,数据可视化,非布局化数据,呆板进修和AI。

  • Apache Spark:https://www.techopedia.com/definition/30113/apache-spark

但假如我们从一份Kaggle调研中寻求线索,关于“那些在现实糊口中被行使的最广泛的器材”,我们会有差异的发明。下面这张图是名列前15的硬手艺。

Python,R和SQL排在前三,第四名是 Jupyter notebooks,接下来是 TensorFlow,Amazon Web Services,Unix shell,Tableau,C/C++,NoSQL,MATLAB/Octave和Java,都排在Hadoop和Spark前面。颇让人不测的是,Microsoft’s Excel Data Mining也被列进来了。

  • TensorFlow:https://www.techopedia.com/definition/32862/tensorflow
  • Amazon Web Services:https://www.techopedia.com/definition/26426/amazon-web-services-aws
  • Unix:https://www.techopedia.com/definition/4637/unix
  • C++:https://www.techopedia.com/definition/26184/c-programming-language
  • NoSQL:https://www.techopedia.com/definition/27689/nosql-database
  • Java:https://www.techopedia.com/definition/3927/java
图片出自 Kaggle
  • https://www.kaggle.com/surveys/2017

在KDnuggests清单中也包罗了关于正规教诲的提议。大大都据科学家都拥有高学历,46%是博士,88%的人拥有至少硕士学位。他们的本科学位凡是是相干规模。约莫1/3是数学和统计学,这也是最受接待的职业轨迹。接下来最受接待的是计较机科学学位,占据19%,工程学16%。虽然专门针对数据科学的技能器材凡是不会设在大学课程中,可是可以通过专门的实习营或在线课程习得。

课程之外:2个要点

Hank Yun是威尔康奈尔医学院肺科的一名助理研究员,同时也是NYC数据科学学院的门生。他提议有幻想的数据科学家环绕他们将要从事的事变举办打算,并找到一位导师。

  • Hank Yun:https://medium.com/@jhaseon

他说:“不要犯我曾经犯过的错误。当时我对本身说,我知道数据科学,由于我介入了课程并得到了证书。”这确实是个不错的开始,但当你开始学的时辰,脑海中要有一个打算。然后在该规模中找到一名导师,并立即开始一个令你布满豪情的项目。

当你照旧个新手,你不知道你不知道什么。以是假若有小我私人指导你前行,汇报你,什么是对付此刻的你最重要的,什么不是,这将很有辅佐。别把时刻扔在进修那些最后基础无法发挥的对象!

知道从你的器材包里取出哪样器材:保持领先的要点

因为数据科学器材的排名不尽沟通,有人也许会狐疑,到底该把精神齐集在哪些上面。Celeste Fralick是McAfee软件安详公司的首席数据科学家。他在CIO article上夸大了这个题目:“一名数据科学家必要处在观测曲线的前端,但别忘了去大白,什么技能该什么时辰用。” 这句话意思是,别被奇怪与性感的外表诱惑,而现实题目必要更多事变。意识到对付生态体系的计较本钱,可表明性,耽误,带宽,和其余体系界线前提,尚有客户的到期时刻,它自己就能辅佐数据科学家知道,行使什么技能最吻合。

  • CIO article:https://www.cio.com/article/3263790/data-science/the-essential-skills-and-traits-of-an-expert-data-scientist.html

根基软手艺:其它6个要点

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读