加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

卓越的数据科学编程说话是R照旧Python?

发布时间:2021-05-23 21:34:31 所属栏目:大数据 来源:互联网
导读:编程说话之间的战斗一向是很多人所感乐趣的。 跟着天下的成长,我们每隔几个月就会有一种新的编程说话或框架。 开拓职员/说明师/研究职员一向在探求可以或许以最低的

编程说话之间的战斗一向是很多人所感乐趣的。 跟着天下的成长,我们每隔几个月就会有一种新的编程说话或框架。 开拓职员/说明师/研究职员一向在探求可以或许以最低的本钱得到精采机能而完成使命的最佳说话。

 

 

 

在问题中行使省略号的缘故起因是,我们一向在探求错误的选择说话的缘故起因。 有多种身分导致选择某种说话。 跟着数据科学项目标大量涌入市场,题目不再是"哪一种是最好的说话",而是哪一种得当您的项目需求和情形(事变情形)。

 

因此,在这篇文章中,我规划向您提出正确的题目集,以便为您的数据科学项目选择最佳的编程说话。

 

数据科学最常用的编程说话

 

Python和R是统计说明或以呆板进修为中心的项目中行使最普及的说话(譬喻Java,Scala,Matlab)。

 

这两种都是最先辈的开源编程说话,具有强盛的社区支持。 您将不绝进修有关实现更高级此外机能和伟大性的新库和器材。

 

Python

 

 

 

Python以其易学易懂的语法而有名。 行使像Python这样的通用说话(全部行业),您可以构建完备的科门生态体系,而不必担忧兼容性或接口题目。

 

Python代码的维护本钱很低,而且可以说更强盛。 从数据清算到成果选择,Web抓取和我们呆板进修模子的陈设,Python可以通过全部首要ML和深度进修API(譬喻Theano,Tensorflow和PyTorch)的集成支持完成险些全部事变。

 

R

 

 

 

R是由院士和统计学家在二十多年前开拓的。 现在,R使很多统计学家,说明师和开拓职员都可以举办说明。 我们在CRAN(开放源代码存储库)中提供了高出12000个软件包。

 

自从开拓职员紧记统计学家以来,R成为全部焦点科学和统计说明的首选。 我们在R中提供了一个软件包,用于险些全部范例的说明。 借助RStudio之类的器材可以很是轻松地举办数据说明,使您可以通过简捷明白的陈诉来转告竣果。

 

4个题目,以相识最得当您的项目标说话!

 

那么,一小我私人如作甚本身的事变做出正确的选择?

 

实行答复以下四个题目:

 

1. 您的组织/行业首选哪种说话/框架?

 

按照您所从事的行业以及偕行和竞争敌手最常用的说话,您也许想说沟通的说话。 这是由David Robinson(数据科学家)举办的说明,这反应了R在行业中的遍及水平,您可以看到R在学术界和医疗保健中的行使很是精彩。

 

因此,假如您想从事研究,学术或生物信息学研究,可以思量行使R over Python。

 

 

 

硬币的另一面是软件行业,应用措施驱动的组织和基于产物的公司。 您也许必需与组织基本架构的技能仓库或同事/团队行使的说话细密团结。

 

并且大大都组织/行业都具有基于Python的基本架构,包罗学术界:

 

 

 

对付有幻想的数据科学家来说,进修具有多种应用措施并也许增进他们得到事变机遇的对象是一个明智的选择。

 

2. 您的项目范畴是什么?

 

这是一个重要的题目,由于在选择一种说话之前,您必需为您的项目确定一个议程,以及要在多洪流平上行使它。

 

R:譬喻,假如您只想通过数据集简朴地办理统计题目,执行一些多元说明,并筹备一份陈诉或表明这些看法的仪表板,R也许会由于其强盛的可视化结果而成为更好的选择 和通信库。

 

Python:另一方面,假如方针是起首举办试探性说明,开拓深度进修模子,然后将该模子陈设到Web应用措施,Python的Web框架以及全部首要云提供商的支持下,那么它无疑是赢家。 。

 

3. 您在数据科学规模的履历怎样?

 

对付对统计和数学观念相识有限的数据科学初学者,Python也许会成为更好的选择,由于它使您可以轻松地编写算法的片断。

 

行使NumPy之类的库,您可以本身哄骗矩阵和编码算法。 作为新手,总要进修从新开始构建对象,而不是跳到行使呆板进修库。

 

而假如您已经相识了呆板进修算法的基本常识,则可以选择个中任何一种说话来开始行使。

 

4. 您手头有几多时刻/学惯用度?

 

您可以投入的时刻又为您选择了另一个案例。 按照您在编程方面的履历和项目标交付时刻,您可以选择一种说话而不是另一种说话来开始该规模。

 

假如您的项目优先级较高,并且您不懂这两种说话,那么R也许是您入门时更轻易的选择,由于您必要有限的编程履历或没有编程履历。 您可以行使现有库用几行代码编写统计模子。

 

假如您有足够的带宽来试探库并相识试探数据集的要领(假如行使R,可以在Rstudio中快速完成),那么Python(措施员的选择)是一个很好的选择。

 

结论

 

简而言之,R和Python成果之间的差距正在缩小。 大大都事变都可以用两种说话完成。 两者都有富厚的生态体系来支持您。

 

然后,为项目选择说话取决于:

 

您先前在数据科学(统计和数学)和编程方面的履历。

当前项目标规模以及所需的统计或科学处理赏罚范畴。

您的项目标将来范畴。

在您的团队,组织和行业中获得最普及支持的说话/框架。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读