Anshumali Shrivastava使用AI来摧毁数据
大数据增添速率高出当前计较机措施可以跟上的速率,GET SMART 计较机科学家Anshumali Shrivastava正在计划奇妙的要领来辅佐计较机措施更智能地事变,而不是更难。天下充斥着数据,而Anshumali Shrivastava也许会让我们免于溺水。 天天在线宣布高出10亿张照片。在一秒钟内,大型强子对撞机可以发生100万千兆的视察值。大数据的膨胀速率比今朝的计较机措施可以说明的速率快。 休斯顿莱斯大学的电气和计较机工程师理查德·巴拉尼克说:“我们拥有复杂的数据海洋,我们必需通过花圃水管将其吸走。” 因此,33岁的计较机科学家Anshumali Shrivastava正在计划新一代的人工智能措施,以有用地处理赏罚大水信息。 麻省理工学院的电气工程师和计较机科学家Piotr Indyk暗示,“他很是有缔造力”的计策可以办理粗笨的数据集题目。“我说个中一些工作,'我但愿我想出来。'它们清楚,雅观,并且有用。“ Shrivastava进入了人工智能,由于办理实际天下题目的数字运算算法是“你看到数学在动作中的处所”,他说。但作为博士Shrivastava是康奈尔大学计较机科学专业的门生,他意识到人工神经收集是云云低效,现在的人工神经收集。 神经收集由称为人工神经元的代码片断构成。为了进修诸如图像辨认之类的使命,AI收集可以研究标志图像,收集中的每小我私人工神经元都得到辨认某些模式的专业常识。 但纵然他们专注,以是典范收集中的全部神经元城市继承研究全部传入的信息。譬喻,当收集看到猫照片时,乃至认真留意卡车的神经元也会引起留意。Shrivastava说,这不须腹地淹灭时刻和精神。 在研究生院,Shrivastava找到了一种辨认和激活与每个输入最相干的神经元的要领。他行使散列函数,在数据库中组织记录的计较器材,就像Dewey Decimal System在图书馆中组织书本一样。 有序存储 计较机可以通过将每个文档馈送到散列函数来组织数据库中的记录,散列函数为记录分派散列码。相同的文档被分派了相同的哈希码并存储在哈希表中的沟通“桶”中 - 相同于统一主题的书本在库中被弃捐在一路的方法。 T. TIBBITTS Shrivastava按照它们与给定输入的相干性,计划了一组哈希函数来组织和快速定位收集中的假造神经元- 因此您可以找到全部猫神经元并忽略卡车神经元。 “我在思量这个题目高出两年,”他说。“你把全部的困难都放在脑后。”当他有一段时刻而且凡是无处可去时,他会回到这个题目。可是回到他身边的那一天,他在几个小时内办理了这个题目。他回想起坐在他的寝室里,阅读并从头阅读他的办理方案,以说服本身它现实上会起浸染。 他提出的体系也许被以为是“昔时呆板进修的最佳研究事变,”赖斯的计较机科学家Moshe Vardi说。它在2014年神经信息处理赏罚体系集会会议上得到了精巧论文奖。 从那往后,Shrivastava成立了一个图像分类神经收集,其事变方法与尺度收集一样,但计较劲镌汰了95%。这样的服从可以开释人工智能措施处理赏罚其他信息的时刻和精神,譬喻,用于语音识此外音频,为更多样化的人工智能铺平阶梯。 自从2015年插手莱斯大学以来,他还开拓了其他简化计较的要领。他“很是智慧,速率极快”,瓦尔迪说。“我们偶然不得不跟随他,由于他的头脑正在向前成长。” Rice和杜克大学的Shrivastava及其同事最近对叙利亚内战受害者数据库举办了散列处理赏罚。为叙利亚斗嘴得到精确的衰亡罪数,以辅佐告状犯有危害人类罪的犯法者已证明是坚苦的。家庭成员,媒体和其他来历陈诉的受害者数据库包括一再记录;计较机必要耗费一周多的时刻才气将全部354,000笔记录彼此较量才气找到一再记录。 一旦Shrivastava的计较机措施为四个受害者数据库中的每个记录分派了哈希码,它就会在几分钟内行使这些代码来辨认也许的一再记录。该打算于6月份在“应用统计年鉴”中陈诉,然后仅搜查了这些记录的匹配环境。 更靠近家庭,Shrivastava及其同事建设了一个智妙手机应用措施,用于按照人的周围情形照片导航购物中心或其他大型构筑物。该应用措施将用户拍摄的照片反应为哈希码,以与参考照片代码举办较量,在两秒钟内准确定位位置。 跟着大数据的泛滥,Shrivastava很轻易被沉没和沮丧。荣幸的是,“他体内没有忽忽不乐的骨头,”巴拉尼克说。 Shrivastava也许会在特定题目上搁浅数月或数年,然后才气得到导致他基于哈希的尤里卡时候的大脑爆炸。但他暗示,当他可以或许将迟钝移动的计较机体系推向高速档时,“这是值得的。” (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |