加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Google科学家最新清算,给新手保举的十篇优越数据科学文章

发布时间:2019-08-21 20:26:07 所属栏目:教程 来源:skura
导读:作为数据科学的初学者,一些好的文章可以或许快速带我们入门这一布满了未知和挑衅的规模。克日,google 决定智库的主管 Cassie Kozyrkov 清算了十篇给门生们保举的 优越 文章。下面这些文章险些都来自于沟通的博客。让我们来看看是哪些文章吧~ #1 领略数据 文

在实况教室上,谷歌用户会高声答复「坐着照旧站着」、「能看到木地板照旧不能看到」、「猫自照相旧不猫自拍」等等,让我们搜查一下第一个谜底。

Google 科学家最新清算,给新手保举的十篇最佳数据科学文章

将图像分成两组的一种要领是:坐着和站着。好吧,「坐」对「站」。

无监视进修的奥秘标签

假如你以为「坐着照旧站着」是标签,那就再想想吧!这就是您用来建设集群的要领(模子)。在无监视的进修中,标签更为乏味:好比「第 1 组和第 2 组」或「A 或 B」或「0 或 1」。它们只是暗示群体成员,没有特另外人类可表明(或诗意)的寄义。

Google 科学家最新清算,给新手保举的十篇最佳数据科学文章

无监视进修的标签只暗示集群成员。他们没有更高的人类可表明的意义,也许会感想令人扫兴的无聊。

这里所产生的统统就是算法通过相似性对事物举办分组。相似性怀抱是由算法的选择来指定的,可是为什么不尽也许多地实行呢?事实,你不知道本身在找什么。

履历教导:

  • 把无监视进修看作是「物以类聚」的数学版本。
  • 功效就像一张卡罗牌,辅佐你实现空想。任何工作都有也许产生,把这个进程当做一次冒险,并全力享受吧!

总结:无监视进修通过将相似的对象分组在一路,辅佐你从数据中找到灵感。界说相似度有许多差异的要领,以是继承实行算法和配置,直到一个很酷的模式吸引你的眼球。

#4 数据科学简史

文章地点:https://www.forbes.com/sites/insights-intelai/2019/05/22/automated-inspiration/#78a3aeb1c44f

在 19 世纪,大夫也许给情感颠簸开含有汞的处方,给哮喘开含有砷的处方。他们也许不会在你手术前洗手。他们不是想杀戮你,只是不知道这样做更好。

这些早期的大夫在他们的条记本上记录着有代价的数据,但就像一个庞大的拼图游戏,每小我私人都只拿了一小块。假如没有共享和说明信息的当代器材以及领略这些数据的科学,那么就没有几多对象可以阻止迷信通过可调查到的外貌究竟来举办判定的要领。

从当时起,人类在技能上取得了长足的前进,但本日呆板进修(ML)和人工智能(AI)的发杀青长并没有真正冲破已往的排场。

其后,人们发现了第一个数据存储和共享技能。存储数据集的手段代表了通往更高智能阶梯上打破性的第一步。

不幸的是,获守信息是一件疾苦的工作。你必需把每一个单词上传到你的大脑来处理赏罚它。这使得早期的数据说明很是耗时,因此最初的研究一向止步不前。

荣幸的是,有一些令人难以置信的先驱。譬喻,JohnSnow 在 1858 年伦敦霍乱发作时代绘制的衰亡舆图,引发了医学界从头思量了这种疾病是由毒气引起的迷信,并开始细心调查饮用水。「拿着灯的密斯」,弗洛伦斯南丁格尔在克里米亚战役时代缔造性的用信息图表说明出医院衰亡的首要缘故起因,拯救了很多人的生命。

数据的美好之处在于它能让你从中形成一种概念。通过查察信息,你会受到开导提出新的题目,。这就是说明学科所要做的:通过试探来鼓励模子和假设。

从数据集到数据支解

在 20 世纪初,在不确定的环境下做出更好抉择的愿望导致了一个平行的职业的降生:统计学。

说明和统计有一个首要的瑕玷:假如你在假设天生和假设测试中行使沟通的数据点,那你就是在作弊。统计的严谨性要求你在采纳动作之前先做出抉择;说明更像是一场过后诸葛亮的游戏。他们险些是悲剧性的不相容,直到下一次重大革命,数据支解改变了统统。

数据支解是一个简朴的设法,但对付像我这样的数据科学家来说,这是最深刻的设法之一。

其后,呆板进修呈现了。

行使数据会议粉碎其作为统计严酷性来历的纯度。假如你有第三个数据集,你可以用它来得到灵感。这个筛选进程被称为验证,它是呆板进修的焦点。

一旦你可以把全部的对象都扔到一路上,你就可以让每小我私人都有机遇想出一个办理方案:履历富厚的说明师、演习生、茶叶,乃至算法,而不必思量你的营业题目。无论哪种办理方案在验证中结果最好,都将成为恰当统计测试的候选者。你只是让本身自动引发灵感!这就是为什么呆板进修是数据集的革命,而不只仅是数据。

用深度神经收集举办呆板进修在技能上被称为深度进修,但它尚有一个外号:人工智能。固然人工智能曾经有差异的寄义,但本日你很也许会发明它被用作深度进修的同义词。

深度神经收集因为在很多伟大的使命上比不太伟大的 ML 算法更轻易分类,因此赢得了他们的赞誉。但它们必要更多的数据来逊??们,而且处理赏罚要求高出了典范的条记本电脑。

#5 呆板进修——天子的新衣?

文章地点:https://medium.com/@kozyrkov/machine-learning-is-the-emperor-wearing-clothes-928fe406fe09

Google 科学家最新清算,给新手保举的十篇最佳数据科学文章

呆板进修行使数据中的模式来标志事物。听起来很神奇?焦点观念现实上很是简朴。假若有人让你认为这是隐秘的,他们应该感想忧伤。

焦点观念很是简朴

我们的标签例子将涉及到将茶分类为鲜味或不鲜味,全部的设法在数学或代码所需手艺上都超等简朴!

Google 科学家最新清算,给新手保举的十篇最佳数据科学文章

道理是什么

数据

让我们想象一下,我品尝了 50 杯茶,并将它们的信息直观地出此刻下面。每一杯都有糖和酿造时刻信息,Y 代表鲜味,N 代表不那么鲜味。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读