MIT再推出有名数据集ImageNet存在系统性Bug,祸端还是WordNet
惨遭下架后,MIT再爆知名数据集ImageNet存在体系性Bug,祸根照旧WordNet 麻省理工研究团队之以是在ICML大会上先容这项研究,是由于近期陷入的“Tiny Images”争议变乱。 就在本月初,麻省理工学院(MIT)公布永世删除了包括8000万张图像的Tiny Images数据集,并果真暗示歉意。其缘故起因是,有关研究职员颁发了一篇论文指控Tiny ImageNet数据集存在多项伤害标签,包罗种族小看、性别小看、色情内容等,并且指控有理有据。 论文中表白,ImageNet在语义布局说明上,行使的WordNet名词,它包括了种族小看等伤害内容,同时,因为图像过小,数据量过大,并未手动对图像标签举办一一查对,由此导致了题目的呈现。 众所周知,知名数据集ImageNet也行使了WordNet用于语义布局说明,那么,ImageNet数据集是否也存在同样的题目?对此,麻省理工研究团队给出了谜底。 ImageNet基准测试与现实不符大局限ImageNet数据集的呈现,可以说意味着呆板进修深度厘革的一个新出发点。2009年,李飞飞领衔的研究团队在计较机视觉与辨认模式大会(CVPR)上初次推出ImageNet,ImageNet数据集包括10000个分类,高出一百万个图像,数据量之大是此从未有过的。 正是因数据量大、质量高,ImageNet数据集被普及用于预实习和基准测试。可是,麻省理工研究团队在最近的研究中却指出: ImageNet存在明明的“体系标注题目”,导致其用作基准数据集时与现实环境并纷歧致。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |