人工智能是大数据天体物理期间的全能钥匙吗?
副问题[/!--empirenews.page--]
我曾经写过一篇文章《和Wall-E一路瞻仰星空》,内里先容了呆板进修在大数据天体物理期间的应用,其高效性、自动化、精确性都给人们留下了深刻的印象。 看上去,人工智能也容许以或许辅佐天文学家有用地办理大数据天体物理期间所面对的困难。然而,人工智能真的是全能的么?本文将从今朝呆板进修的范围性切磋一下呆板进修在天体物理中的应用范畴。 01 刚需:大数据天体物理期间到来 跟着视察技能的成长,天文数据呈指数型增添。譬喻,闻名的斯隆巡天(The Sloan Digital Sky Survey)[1]开始于2000年,视察到了约300万个天体,数据量约莫是40TB。而今朝正在运行的暗能量巡天(The Dark Energy Survey)[2]的数据量至少是斯隆巡天的100倍。将来欧洲的欧几里得巡天(Euclid)[3]以及美国的大视场时空巡天(LSST)[4]则会把数据量推到惊人的50PB和200PB(1PB=1024TB)。 仅仅是可视察星系一种天体的样本数量,就将到达数十亿。因此,以往传统编程加人工处理赏罚方法的服从已经不敷以应付这样复杂的数据量了。譬喻,把上百亿的星系凭证哈勃星系图表(图1)分类的事变量就多到让人望而却步,这还仅仅是天体物理学研究的根基操纵。 也就是说,高效的自动化数据处理赏罚将成为刚需。幸大好人工智能技能在已往的十几年里有了突飞猛进的成长,好比图样辨认技能已经可以快速地把互联网上的图片举办分类。天文学家们受此开导,开始把人工智能规模里的相干技能应用到天文数据的自动化处理赏罚中。 图1. 哈勃星系分类图表 ,最左侧分支(E)是椭圆星系,由左到右椭率逐渐增大。S0代表椭圆星系和漩涡星系的临界点。Sa,b,c分支代表通例漩涡星系,由a到b星系的光度中漩臂占的比重越来越大。SB分支代表具有棒布局的漩涡星系,由a到b的排序不但思量了光度比还思量的悬臂的开放水平。图片来历:https://en.wikipedia.org/wiki/Hubble_sequence 02 应用:分类、回归与天生 闻名科学家赫伯特·西蒙(Herbert Simon,1975年图灵奖和1978年诺贝尔经济学奖得主)给呆板进修下过界说——“呆板进修是计较机措施通过摄取数据来自行改造机能的进程”。呆板进修和传统措施基础的差异就是编程逻辑:呆板进修的理念是归纳法,而传统编程更倾向于演绎法。 譬喻,假如想用传统编程要领对星系的外形分类,我们需先丈量星系的外形参数,然后设定阈值,再按照外形参数和阈值的相关对星系分类;而呆板进修的逻辑则是:先成立一个普适的模子,不提供特定参数或阈值,只输入星系图像和归类标签,这个模子就会按照输入的数据自我调解,从而演化成一个可用于星系外形分类的分类器。图2展示了传统措施和呆板进修措施事变流程的差别。 图2. 传统编程和呆板进修编程逻辑的差别。图片来历: https://www.futurice.com/blog/differences-between-machine-learning-and-software-engineering/ 眼下,天文学家首要应用呆板进修办理分类、回归、天生中分体,乐成案例包罗星系外形分类和指定天体辨识(图3)、天体物理征象的快速自动化建模(图5)以及仿真图像的天生(图6)。综合来看呆板进修在办理天体物理学题目上具有以下利益:1)包围范畴广,普适性好;2)数据驱动,上限明明高于传统要领;3)开举事度越来越低,移植性好。这些利益使得呆板进修的要领在天体物理尤其是大数据期间的天体物理中越来越风行,险些在各个天体物理学规模乃至各个科学规模都能看到其身影。 图3. 应用监视进修和非监视进修举办星系外形分类的典型。上图为监视进修分类功效的典型[5],下图为非监视进修星系分类功效的典型[6]。两个要领都能较量好地按照外形对星系举办分类了,假若有乐趣相识更多细节,请会见图片来历链接里的论文(文末参考文献,下同)。 图4. 应用呆板进修办理“回归题目”的实例。左图为宇宙中的投影物质漫衍表示图,右图为呆板进修的要领按照宇宙中的投影物质漫衍预言的宇宙学参数[7]。这个应用的根基头脑是通过呆板进修的算法成立起左图和由图中宇宙学参数的对应相关,这样在未来有新的物质漫衍的数据的时辰,只要输入实习好的模子中,就可以快速地返回对应的宇宙学参数了。 图5. 呆板进修算法天生的仿真星系图像与真实图像的比拟[8]。左图为呆板进修天生的无噪音漩涡星系,中图为添加噪音之后的仿真图像,右图为哈勃望远镜所视察到的图像。天生尽也许真实的数值模仿的图像有助于天文学家测试和校正数据处理赏罚软件和科学建模软件。 03 短板:门槛、数据与黑盒子 然而,呆板进修并非无所不能。起首其超高的计较劲和出格的硬件需求使其入门门槛要高于传统要领。其它,模子计划很是伟大,要投入大量的人力、物力和时刻来开拓新算法及模子,大部门人只能行使现有的模子。并且,呆板进修是一个随机的进程,功效的统计性是自洽的,但无法在个别功效上实现多次美满重现。 譬喻,应用呆板进修实现分类操纵时,小部门方针天体每次的分类功效城市纷歧样;应用呆板进修实现回归计较时,每次预言的参数也都不是可一再的牢靠值,尽量不确定性很小。因此,应用呆板进修研究天体物理学题目时,有明晰一对一相关的物理进程(如星系动力学仿真和引力透镜光泽追踪仿真等)依然必要传统要领来实现。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |