加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

MIT再推出著名数据集ImageNet存在体系性Bug,祸根照旧WordNet

发布时间:2021-06-06 00:57:17 所属栏目:创业 来源:互联网
导读:惨遭下架后,MIT再爆知名数据集ImageNet存在体系性Bug,祸根照旧WordNet 麻省理工研究团队之以是在ICML大会上先容这项研究,是由于近期陷入的Tiny Images争议事

惨遭下架后,MIT再爆知名数据集ImageNet存在体系性Bug,祸根照旧WordNet

麻省理工研究团队之以是在ICML大会上先容这项研究,是由于近期陷入的“Tiny Images”争议变乱。

就在本月初,麻省理工学院(MIT)公布永世删除了包括8000万张图像的Tiny Images数据集,并果真暗示歉意。其缘故起因是,有关研究职员颁发了一篇论文指控Tiny ImageNet数据集存在多项伤害标签,包罗种族小看、性别小看、色情内容等,并且指控有理有据。

论文中表白,ImageNet在语义布局说明上,行使的WordNet名词,它包括了种族小看等伤害内容,同时,因为图像过小,数据量过大,并未手动对图像标签举办一一查对,由此导致了题目的呈现。

众所周知,知名数据集ImageNet也行使了WordNet用于语义布局说明,那么,ImageNet数据集是否也存在同样的题目?对此,麻省理工研究团队给出了谜底。

ImageNet基准测试与现实不符

大局限ImageNet数据集的呈现,可以说意味着呆板进修深度厘革的一个新出发点。2009年,李飞飞领衔的研究团队在计较机视觉与辨认模式大会(CVPR)上初次推出ImageNet,ImageNet数据集包括10000个分类,高出一百万个图像,数据量之大是此从未有过的。

正是因数据量大、质量高,ImageNet数据集被普及用于预实习和基准测试。可是,麻省理工研究团队在最近的研究中却指出:

ImageNet存在明明的“体系标注题目”,导致其用作基准数据集时与现实环境并纷歧致。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读