真的缺数据科学家吗? 现在到底有几多数据科学家?
副问题[/!--empirenews.page--]
【51CTO技能沙龙】10月27日,让我们配合试探AI场景化应用实现之道
2011年,麦肯锡宣布的《大数据》陈诉称,“仅美国就面对着14万至19万名具有说明特长的人才欠缺,以及150万名具备领略并基于大数据说明做出决定手段的打点职员和说明师的欠缺”。 2014年,我们观测了数据科学家的数目,其时的预计为50名至10万名,且其时并没有看到数据科学家大量欠缺的证据。2014年,我们在indeed.com网站上仅发明白约1000个“数据科学家”的雇用告白。 2016年,我们研究了德勤的一项研究。德勤在研究中猜测:到2018年,企业将必要100万名数据科学家。 此刻已经是2018年了,以是我们可以检讨上述猜测的精确水平,而且实行答复以下三个题目:
1 数据科学家欠缺吗? 第一个题目的谜底好像是必定的。 LinkedIn公司在2018年8月宣布的美国劳动力陈诉中提到:“对数据科学家的需求空前高涨……具稀有据科学手艺的人才欠缺题目险些存在于美国的全部多半会。在全美国范畴内,共穷乏151717名具稀有据科学手艺的人,个中纽约市(34032人)、旧金山湾区(31798人)和洛杉矶(12251人)的人才欠缺尤为严峻。” 值得留意的是,LinkedIn陈诉中的人才欠缺是指具有“数据科学手艺”的人,而不必然是拥有“数据科学家”头衔的人。 我们可以通过两个热点的求职网站——indeed和Glassdoor——来预计对“数据科学家”的需求。 在indeed.com网站上搜刮美国的“data scientist”(加引号),只能找到约4800个事变岗亭。 (留意:在indeed网站长举办搜刮时行使引号异常重要。搜刮没有加引号的data scientist可以找到约3万个事变岗亭,但我们不确定这些事变岗亭中有几多是针对其他规模的科学家的。) 美国事数据科学家最大的市场,却非独一的市场。通过在indeed的地区性站点(indeed.co.uk、indeed.fr、indeed.de、indeed.co.in等)长举办搜刮,我们可以发明其他国度对数据科学家也有凶猛的需求: 在Glassdoor网站上输入“Data Scientist”举办搜刮,可发明美国约莫有2.6万个事变岗亭(删除引号也会获得同样的功效)。 2 现阶段有几多“数据科学家”? 谷歌搜刮将数据科学家界说为:“受招聘于说明息争释伟大的数字数据(如网站的行使统计数据)的人,从而帮忙企业做出决定。” 因为数据科学是集统计学、计较机科学、呆板进修和贸易于一体的交错学科,因此在业界和学术界有很多人虽从事这项事变却没有正式的数据科学家头衔。因而我们可以通过观测风行的数据科学平台来预计当前数据科学家的数目。 Kaggle(此刻是Google的一部门)是一个数据科学和数据说明的比赛平台,它声称是天下上最大的活泼数据科学家社区。固然并非全部数据科学家都介入过Kaggle角逐或拥有Kaggle账户,且并非Kaggle上的全部职员都从事数据科学事变,但我们可以公道地假设数据科学家群体与Kaggle职员群体存在大量重叠。 2017年6月,Kaggle的社区成员数目打破了100万。2018年9月19日的Kaggle电子邮件称,他们的社区成员数目在2018年8月高出了200万。因为并非全部Kaggle成员都是活泼的,以是Kaggle的社区成员总数也许是环球从事数据科学的人的数目最大值。 KDnuggets网站此刻每个月有高出50万名独立访客,因为网站专注于辅佐数据科学家和呆板进修工程师更好地完成他们的事变,因而我们可以公道地以为网站的大大都访客都在数据科学或呆板进修规模事变,无论他们的现实头衔是什么。但因为部门访客也许是有时中随机遇见了KDnuggets,因而我们可以相识网站的订阅者或粉丝——这个更活泼的子集。 KDnuggets今朝在Twitter、LinkedIn、Facebook、RSS和电子邮件上拥有约24万名订阅者或粉丝。固然差异平台的人会有一些重叠,但对付环球浩瀚的数据科学家来说,约莫20万的人数预估好像是公道的最小值。 在LinkedIn上,有很多致力于数据科学的组织。尽量这些组织的参加度一向在降落,但我们可以大致地预计他们的成员数目。以下是三个最大的数据科学组织的预估成员数目: 这些组织成员的头衔有着庞大的多样性,这些头衔包罗数据科学家、数据说明师、统计学家、生物信息学家、神经科学家、市场营销主管、计较机科学家等等……可以必定地说,任何从事着传统数据科学家所从事的事变的人都可被以为属于这一种别。跟着越来越多的人必要通过说明数据来得到看法或做出要害决定,传统上地位和职责差异的人们都热衷于进修数据说明这一新技能,以顺应本身的规模。这固然并不能使他们从基础上成为数据科学家,但他们确实拥有该规模的常识和才气。 我们还可以从数据科学家的LinkedIn小我私人资料中获取一些有效信息,这些资料表现有高出10万人拥稀有据科学家头衔。 ![]() 图1:LinkedIn数据科学家简介(按行业和所在分类) 在LinkedIn上搜刮“数据科学家”(加引号很重要),我们发明高出10万人拥有该头衔。 因此,假如环球有20万到100万人在做一些与数据科学相干的事变,那么他们中的大大都人都没稀有据科学家的头衔。 我们还可以通过查察与数据科学最相干的说话僻静台(R、Python、呆板进修库、Spark和Jupyter)相干的勾当来估算大型数据说明/可视化/统计社区的局限。 Apache Spark Meetups上现有22.5万名成员,并且每个月都在增添。 Intel Capital预计环球有100万R措施员。 按照python.org网站上的果真数据,此刻已有约275万次的下载量。 Jupyter项目今朝拥有约300万用户。 这些数字可觉得我们提供环球数据说明师或数据科学家数目的大致上限。 3 数据科学家的将来远景 数据科学家近期的远景看起来很光亮。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |