MIT再推出著名数据集ImageNet存在体系性Bug，祸根照旧WordNet

发布时间：2021-06-06 00:57:17 所属栏目：创业来源：互联网

导读：惨遭下架后，MIT再爆知名数据集ImageNet存在体系性Bug，祸根照旧WordNet 麻省理工研究团队之以是在ICML大会上先容这项研究，是由于近期陷入的Tiny Images争议事

惨遭下架后，MIT再爆知名数据集ImageNet存在体系性Bug，祸根照旧WordNet

麻省理工研究团队之以是在ICML大会上先容这项研究，是由于近期陷入的“Tiny Images”争议变乱。

就在本月初，麻省理工学院（MIT）公布永世删除了包括8000万张图像的Tiny Images数据集，并果真暗示歉意。其缘故起因是，有关研究职员颁发了一篇论文指控Tiny ImageNet数据集存在多项伤害标签，包罗种族小看、性别小看、色情内容等，并且指控有理有据。

论文中表白，ImageNet在语义布局说明上，行使的WordNet名词，它包括了种族小看等伤害内容，同时，因为图像过小，数据量过大，并未手动对图像标签举办一一查对，由此导致了题目的呈现。

众所周知，知名数据集ImageNet也行使了WordNet用于语义布局说明，那么，ImageNet数据集是否也存在同样的题目？对此，麻省理工研究团队给出了谜底。

ImageNet基准测试与现实不符

大局限ImageNet数据集的呈现，可以说意味着呆板进修深度厘革的一个新出发点。2009年，李飞飞领衔的研究团队在计较机视觉与辨认模式大会（CVPR）上初次推出ImageNet，ImageNet数据集包括10000个分类，高出一百万个图像，数据量之大是此从未有过的。

正是因数据量大、质量高，ImageNet数据集被普及用于预实习和基准测试。可是，麻省理工研究团队在最近的研究中却指出：

ImageNet存在明明的“体系标注题目”，导致其用作基准数据集时与现实环境并纷歧致。

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2021创业做什么好？低	香港虚拟主机，香港虚
《启航当风起时》起于	域名最网站至关重要如