Google科学家最新清算,给新手保举的十篇优越数据科学文章
副问题[/!--empirenews.page--]
作为数据科学的初学者,一些好的文章可以或许快速带我们入门这一布满了未知和挑衅的规模。克日,google 决定智库的主管 Cassie Kozyrkov 清算了十篇给门生们保举的优越文章。下面这些文章险些都来自于沟通的博客。让我们来看看是哪些文章吧~ 文章地点: 假如你从网上购置数据集开始你的进修路程,你就有也许健忘它们从何而来。 ![]() 怎样暗示这些并没有一个广泛的纪律,食品的重量单元是克,是最好留意的。我们可以选择数目、价值、原产国或其他得当我们要求的商品。 假如你闭上眼睛,你还记得适才看到的每一个细节吗?我横竖不记得了。这就是我们网络数据的缘故起因。假如我们能在脑子中很好地影象和处理赏罚它,就没有须要了。 当我们说明数据时,我们正在会见别人的影象。 固然,用手在纸上打草稿也可以,可是当数据量很大的时辰,我们最好照旧用电脑吧。 我们可以用 excel 处理赏罚很大都据。 ![]() 虽然,你还可以选择 python。 为了加快你的实习,不要只是粘贴邪术单词-实行改变它们,看看会产生什么。譬喻,假如您在上面的代码片断中将「真」变为「假」,会产生什么变革? 编程是邪术和乐高之间的交错点。假如你但愿本身能变把戏,那就学着写代码吧。 简而言之,这是一个措施计划:扣问互联网怎样做一些工作,用你刚学过的神奇单词,看看当你调解它们时会产生什么,然后把它们像乐高积木一样放在一路来完成你的出价。 我们必要举办说明和总结。为此,你还必要相识很大都学常识,如中位数、众数等。这些常识被称为统计学。 ![]() 你还必要进修画图和可视化。凡是,直方图和条形图被行使的较量多。 ![]() 数据没有什么神奇之处,它只是在记录上比大脑更靠得住。一些信息是有效的,有些是误导性的。我们都是数据说明师,一向都是。 #2 向孩子(或你的老板)表明监视进修文章地点: 既然你知道什么是呆板进修,让我们来看看最简朴的那种。我的方针是让全部人(险些)全部年数段的人都能顺应它的根基术语:实例、标签、特征、模子、算法和有监视的进修。 实例 看下面四个例子! ![]() 实例也称为「示例」或「调查」。 数据表 当我们把这些例子放在一张表格上时,它们是什么样子的?每一行都是一个例子。 ![]() 这次我们很荣幸,每个实例都有一个标签。 标签 标签是正确的谜底。这就是我们但愿计较机在表现像这样的照片时学会输出的对象,这就是为什么有些人喜好行使「方针」、「输出」或「相应」这个词的缘故起因。 特性 其他列有什么?像素颜色。与你差异的是,电脑看到的图像都是数字,而不是大度的妹子。你看到的是红绿蓝这三种颜色。不信托?实行将「我的数据表」中的值输入到这个 RGB 颜色节制盘中,看看它给你表现什么颜色。想知道怎样从照片中获取像素值吗?看看这个代码。 ![]() 你知道什么很酷吗?每次你看一张数码照片,你说明数据,弄清晰存储在一堆数字中的对象。不管你是谁,你已经是一个数据说明师了! 模子与算法我们的特性将组成模子的基本,计较机将行使它们把像素颜色酿成标签。 模子只是「配方」的一个花哨的词。 详细怎样做?这就是呆板进修算法的事变。 监视进修![]() 我想让你成为我的呆板进修体系。行使你的大脑,再看一眼实例,做一些进修,你认为这是什么? 行使你从上面的示例中进修到的内容对该图像举办分类。 ![]() 「金发」?是的。你大白了!你适才做的是监视进修,太棒了!你此刻经验了最简朴的进修方法。假如你能把你的题目界说为有监视的进修,那是个好主意。其余的更难……以是我们必要行使无监视进修。 总结:假如算法在每个实例中都有正确的标签,那么这将是有监视的进修。稍后,它将行使模子或配方来标志新实例,就像你所做的那样。 #3 无监视进修文章地点:https://hackernoon.com/unsupervised-learning-demystified-4060eecedeaf?source=post_page-----3bae97d9bb23---------------------- 无监视进修听起来像是一种怪异的表达方法,「让孩子们本身进修,不要触摸热烤箱」,但它现实上是一种从你的数据中发掘灵感和模式的技能。 ![]() 什么是无监视进修? ![]() (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |