加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

之前许多人说“大数据就是将来”,这句话有短处没?

发布时间:2021-05-30 09:08:07 所属栏目:大数据 来源:互联网
导读:追念昔时,在我刚开始攻读数据科学硕士学位的灵活光阴里,任何与大数据相干的主题城市让我欢快不已。我试图发掘每一组数据中属于3V的一部门。我想要从无限的数据

追念昔时,在我刚开始攻读数据科学硕士学位的灵活光阴里,任何与大数据相干的主题城市让我欢快不已。我试图发掘每一组数据中属于3V的一部门。我想要从无限的数据流中提炼出可说明的数据,然后建模、可视化、举办数据转换。

然而现在,平日看到“大数据”这个词,总会不自觉地让我扬起眉毛,心田不绝地意料接下来又会呈现哪个同样“风行”又“恍惚”的科技热词呢?

毕竟是我变了,照旧大数据变了?

风行词与实际

最近,我对风行词变得异常敏感。它们被高估了,现实上不具有任何意义。“让大数据为数字化期间带来创新”,这句话看上去很酷,但它的意义又是什么呢?实际也许逗留在Excel电子表格、令人沮丧且迟钝的计较中。

大数据之以是令人感想欢快,是由于它代表了一种庞大的财产(“它将是一种庞大的财产”,听起来耳熟吗?),你可以在个中搜刮、查找并行使对你有代价的任何对象。

我最初对付大数据的观点是,“在全部这些数据中,必定有什么对象是我们绝对想知道的”。或者这是对的,但要从大量数据中找到那些有代价的对象,我们要支付什么价钱呢?

没有正确的基本架构,大数据将毫无用处

处理赏罚大量数据必要计较手段,存储手段、以及数据传输等手段。同时,还会碰着各类意想不到的瓶颈。

跟着云平台的成长,计较手段变得越发自制和易于行使,但云存储也在指数级增添,云计较的一般行使乃至当地处事器的维护都是一笔不小的开销。

这也就是本世纪关于数据的较量大的教导:偶然辰,对某些人而言像黄金一样的数据,于另一些人而言就是挥霍整个存储空间的垃圾。

许多公司都是先费钱发掘数据,然后再回过甚来看哪些数据是真的有效的。用度却已经花掉了,但有没有效可不必然。

那假如我们在网络数据之前就优先确定命据是否有效,功效会怎么样呢?

不是全部数据都是风趣的数据

数据科学界有句话叫“无用输入再无效输出”。在现实应用中,有很大都据现实上是不行靠的,并且是必要下很大工夫整理才气被行使的。

凡是,我们耗费了大量精神、时刻和款子却只能在复杂的数据齐集找到少量信息。按照Forrester的陈诉,企业内至少60%的数据仍未行使。

假如将这些未行使数据的存储本钱投资在现实必要的数据的正确基本架构中,会怎么样呢?

数据越多越好吗?

“向AI投入尽也许多的数据”的期间已经竣事了。人们已经意识到,不是每一个数据特征都是有效的,有些乃至也许有害,数据的质量每每比数目越发重要。

我们更但愿数据可以或许以靠得住、同等的方法来泛起我们体谅的工作。通过相识数据的质量,也会更好地将我们领入一个可表明的、认真任的和安详的关于AI的研究试探阶段。

这是(大型)实验和(大型)搭建更好的基本架构的期间

我们已经得到了数据,此刻必要做的是搭建更完美的基本架构,从而更安详地行使、共享、说明数据,而且可以或许越发精准地域分无用数据和有代价的信息。

我们还必要确保数据和人工智能的质量和靠得住性,确保全天下都可以行使它们并领略个中涵义。尽量有些人很难领略这一点,但数据不在于复杂,而在于靠得住。

尽量听上去没有其他标语那样有煽惑力,可是我照旧要讲:大数据已死,靠得住的数据万岁!

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读