加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据科学家vs数据分析师,到底有啥差异?

发布时间:2021-05-27 22:35:46 所属栏目:大数据 来源:互联网
导读:数据科学和呆板进修两个规模很轻易夹杂,从职责描写上照旧各人的广泛印象里,这两个地位都差不多。相较之下,数据科学和数据说明这两个地位更轻易区分。它们虽有
副问题[/!--empirenews.page--]

数据科学和呆板进修两个规模很轻易夹杂,从职责描写上照旧各人的广泛印象里,这两个地位都差不多。相较之下,数据科学和数据说明这两个地位更轻易区分。它们虽有要害不同,但也有相似之处。

 

有人会说,要成为一名数据科学家,要先从数据说明的事变做起。

 

作者在两个规模都待过,本文旨在阐发成为数据科学家和数据说明师到底意味着什么。一路来看看~

 

之前我是数据说明师的时辰,我想继承深造成为一名数据科学家,我意识到两者有很大差异。并不是说数据科学与数据说明用完全纷歧样的器材和编程说话,我乃至认为数据科学是数据说明的一种情势,由于最终你是在与数据打交道——转换名目,举办可视化,得出可用的结论。

 

数据科学家

 

 

 

代码示例,用于拟合数据科学中的模子并做猜测。来历:作者的屏幕截图。

 

换一个角度看数据科学,这是一个实验自动化统计的行业,行使各类模子来举办分类和猜测。下面是成为一名数据科学家必备的一些手艺:

 

Python 可能 R

SQL

Jupyter Notebook

算法/建模

(1) Python——按照我小我私人履历,大部门公司倾向于用Python而不是R作为首要编程说话。固然地位描写里也许会同时列出两者;可是,我猜你身边的大大都人——好比呆板进修工程师、数据工程师和软件工程师——都不怎么认识R。因此,要想成为一名更全面的数据科学家,Python应该更有效。

 

(2) SQL——乍看之下更像是数据说明师的手艺,确实云云,但SQL还是你从事数据科学必备的手艺。事变中数据集每每不会直接发给你的,这跟学术界差异,你必要通过SQL得到本身的数据集。此刻有许多SQL的分支,好比PostgreSQL、MySQL、Microsoft SQL Server T-SQL,以及Oracle SQL。它们都属于统一种查询说话,情势靠近,但平台差异。因此,会个中任何一种就行,换到另一种SQL很轻易。

 

(3) Jupyter Notebook——数据科学家的游乐场,既可以用于编程也可以建模。你可以把Jupyter看成一个研究器材,你可以编程,写代码,注释掉代码,挪用sklearn、pandas和numpy这些库来建模和测试。

 

(4) 算法——数据科学家的首要职责是用算法来快速精确地猜测、分类,以及按照数据来给提议。每当你用新的数据来实习模子,就会获得一些新的功效。要害的算法凡是分成两大类:无监视进修(如聚类)和有监视进修(如分类/回归)。

 

一些详细的要害算法:

 

随机丛林(系综分类)

Logistic回归(分类——不是回归)

K-Means(聚类)

K-最近邻(分类/回归)

总的来说,数据科学家要做许多事,但首要职责是:

 

与有关部分一路界说要办理的题目

获取数据(行使SQL)

试探性的数据说明、特性工程、模子构建、猜测(行使Python、Jupyter Notebook、各类算法)

按照事变场景,将代码体例成.py文件和/或用于陈设的模子

数据说明师

 

 

 

数据说明师与营业说明师、贸易谍报说明师,乃至Tableau开拓职员有着相似的头衔。数据说明的重点是描写和可视化数据所包括的信息,然后向非技能用户通报并做进一步的表明声名。做猜测说明的数据说明师跟数据科学家的事变有许多重叠部门——与数据科学家有更多相似之处,但不是通过自动化、算法化的要领来输出猜测的。

 

数据说明师必要具备的一些首要手艺有:

 

SQL

Excel

Tableau(可能其他可视化器材,好比Google Data Studio)

(1) SQL——前文提到过数据科学家怎样行使SQL,数据说明师也会举办相同的操纵。可是,SQL对数据说明师更重要。数据科学家也许只是简朴地从表单中选择列就可以了,而数据说明师却要执行更为伟大的查询操纵(譬喻,常用的表单表达式,数据透视表,窗口函数,子查询)。差异公司环境差异,偶然辰数据说明师更靠近数据工程师,而非数据科学家。

 

(2) Excel——很老派,但依然很强盛,你乃至可以用它做猜测说明和趋势说明。首要的坑爹之处是跟Python比速率太慢。

 

(3) Tableau——可视化器材,但按照我的履历,大大都公司都把它明晰列为数据说明师的必备手艺。在Tableau中可以拖放数据到预设图表,简朴强盛;尚有更多伟大的高级成果,好比计较字段,毗连到一个及时的SQL数据库而非基于静态的Excel表单举办说明。

 

总的来说,数据说明师也要做许多事,但首要职能是:

 

与相干部分界说要办理的营业题目

获取数据(行使SQL)

试探性的数据说明、趋势说明和可视化(行使Excel和Tableau)——按照事变场景,向有关部分展示从数据中得到的发明,并提供可行性的提议

相似点

 

前面已经概述了一些相似点,总结一下,数据科学家和数据说明师在所用编程说话、平台/器材,以及所办理的题目方面,都有配合之处。

 

这些器材包罗但不限于SQL、Tableau,以及相似的说明流程,界说题目、说明数据和输出功效。

 

差别

 

尽量有相似之处,但这两个规模之间如故有差别。

 

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读