加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

数据科学难在实践,有哪些弯路可以不走?

发布时间:2019-03-26 22:22:18 所属栏目:教程 来源:大数据文摘
导读:大数据文摘出品 编译:李雷、栾红叶 数据科学这一名词风行了这么长时刻,对付许多企业来说如故是认识而又生疏的词汇。 对付起劲向机关数据科学应用的企业来说,怎样停止走弯路是始终追求的方针。 Blue Yonder,一个创立于2008年的大数据说明平台,用他8年

为了防备或办理这些题目,我们必需接管DevOps模式的根基原则:

  • 调解全部团队的方针,使他们在事变上不至于发生“斗嘴”,而是全力实现配合方针。
  • 拆除部分之间的墙,成立跨职能团队
  • 按照用户附加值的估计,改造决定方法并分派资源和成果

关于理睬

决定是任何公司乐成的焦点。因此,在引入数据科学时,,整个公司,包罗全部的率领层和部分,都必要接管并重视。

运用数据科学举办自动化决定是代价流的重要构成部门。这很也许意味着,你必要改变既定的流程,重组团队,从头思量公司的组织架构。

另外,想要乐成执行这些法子,你必要得到须要的承认。每小我私人都必要知道为什么会有这些改变,而且还要支持这些决定。假如没有这种诚挚的信誉,自动化决定就不行能会乐成执行。

相干链接:

https://www.datascience.com/blog/stakeholder-buy-in-for-data-science-product

反过来,你的数据科学事变必需着重于真正的附加值:一个是必要评估执行本钱,包罗技能债务本钱、伟大性的累积、纠结的增进等;另一方面也要将其与改造后的预期收益举办较量。

数据科学从来不是一个以自我为方针的团队。

相干链接:https://www.datascience.com/blog/agile-data-science)

拆除数据科学的自我壁垒

DevOps的一个要害方针就是使团队连合以实现公司的配合方针,而且也要拆毁差异团队之间的壁垒。由于,假如把数据科学家分到一个单独的小组,布置在一个单独的房间里,这将会是一条通往失败的必经之路。

相干链接:

https://www.datascience.com/blog/centralized-data-science

相反,假如我们将数据科学家布置到一个跨职能的团队中,这将有助于构建一个端到端的完备决定体系,并有助于使其事变与公司方针保持同等。一旦每个部分都毗连起来,数据科学家的事变就不会与其他部分相抵牾。

相反,这种决定体系的乐成将酿成公司的配合好处。以配合全力为特点的整体优化就可以或许实现一个配合方针,这将会代替以自我为中心和纷歧致的方针为特性的局部优化。

这个跨职能团队和其他的团队一样致力于沟通的质量尺度,在质量、弹性或妥当性方面没有任何妥协的余地。

相反,因为自动化决定具有较高的风险,我们必要回收更高的尺度。同时,遵循“精益头脑”的要领,缔造一个既自制又安详的尝试情形。

用奥卡姆剃刀与贪心作斗争

有一个办理题目的原则叫做奥卡姆剃刀(Occam’s razor),也就是:“在彼此竞争的假说中,应该选择假设起码的。”在数据科学规模,我们可以将这个原则从头表述为:

假如两个数据科学模子的功效是兼容的,那么就回收资源包围面较小的模子。

这条简朴的法则为我们提供了怎样成立数据科学模子的明晰指导,办理了数据科学固有的贪心性题目。

假如不丈量天生值并在整个实现周期中应用此原则,您也许谋面对本钱激增,回报有限的题目。

相干链接:

https://www.datascience.com/blog/lessons-from-a-canceled-data-science-project

以是,必必要确保数据科学家致力于这一重要原则,由于与数据科学家反抗长短常坚苦的。他们稀有据和专业常识来提出难以提出贰言的论点。

缔造一种尽也许简朴的,但又失须要的伟大的服从文化。

这同样合用于差异数据源的行使。在数据安详规模,有一个“必要知道”(need to know)的原则,即只有必要会见的人才气会见数据。

也就是在数据科学的应用中,我们必要权衡所特殊添加的数据源的代价,假如改造不足明显,无法证明特殊数据的相干性,那么就要严酷破除这些数据源。

结语

数据科学也就是用来支持和自动化决定的。对大大都公司来说,这变得比以往任何时辰都重要。因为它是一个决定体系,以是必需成为营业流程的焦点。这一究竟带来了一系列严峻的题目,出格是文化性子的题目,也许是劫难性的。

没有诚意的实行每每会导致时刻和款子的挥霍,同时还加重了数据科学作为贫困制造者的荣誉。

将数据科学举办公道的整合是一个不行忽视的转折点。用DevOps模式来接管数据科学,丈量重要的KPIs,从尝试中进修,并不绝改造流程。这是一条真正成为数据驱动公司的阶梯。

作者Twitter: https://twitter.com/sebineubauer

相干报道:

https://www.datascience.com/blog/why-is-it-so-hard-to-put-data-science-in-production

【本文是51CTO专栏机构大数据文摘的原创译文,微信公家号“大数据文摘( id: BigDataDigest)”】

     大数据文摘二维码

戳这里,看该作者更多好文

【编辑保举】

  1. “老司机”划重点!搞定这120个真实口试题目,杀进数据科学圈
  2. 京东JDK在大数据平台的试探与研究
  3. 突发宕机,Kafka写入的数据怎样担保不丢失?
  4. 为什么MySQL数据库要用B+树存储索引?
  5. 想伪装成资深措施员?知道这三个数据布局就够了
【责任编辑:赵宁宁 TEL:(010)68476606】
点赞 0

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读