加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

探寻五千年历史变迁,浪潮AI加速中国考古DNA研究

发布时间:2019-08-01 22:25:35 所属栏目:创业 来源:搜狐IT
导读:中国首座考古DNA尝试室,借助海潮AI计较的FPGA产物方案,其对昔人类的全基因组样本(WGS)说明时刻,从原本的2周收缩到近9小时。 隐秘的古DNA研究有多灾? 上下五千年,各民族在中华大地上生息繁衍、融合变迁,留下了许多未解之谜。为相识开这些谜团,考古学、民族

中国首座“考古DNA尝试室”,借助海潮AI计较的FPGA产物方案,其对昔人类的全基因组样本(WGS)说明时刻,从原本的2周收缩到近9小时。

隐秘的古DNA研究有多“难”?

上下五千年,各民族在中华大地上生息繁衍、融合变迁,留下了许多未解之谜。为相识开这些谜团,考古学、民族学专家运用多种要领举办了试探。连年来鼓起了一种新要领——古DNA技能,为考古研究提供了越发直接有力的证据,开发了全新的视角。

探寻五千年汗青变迁,海潮AI加快中国考古DNA研究

古DNA是指从古代人类和动物遗骸以及古生物化石中提取的古代生物分子。把古代DNA数据同当代基因库中的数据资料相团结,便可以构建出某生平物门类的体系发育树,从而进一步切磋人类的演化与迁徙、民族融合、早期农业成长、动植物的家养与驯化进程等重大题目。

古DNA研究必要颠末提取、扩增、测序等步调,比当代DNA研究要可贵多。出格是提取DNA分子很是坚苦,由于古生物没有出格的存储前提,在天然情形下,DNA齐备地生涯下来并不轻易。DNA储存在细胞核内,生物体在衰亡进程中,细胞就会逐渐产生自溶,DNA很快会被降解。其它,在高暖和湿润的前提下,DNA自身也轻易产生水解、断裂。同时,即便有细胞生涯下来也会遇到其余微生物的进驻,所发生的酶类也会把原细胞内的DNA粉碎掉;因此,一样平常衰亡的动物和人的尸体,DNA很难完备生涯下来。

这些缘故起因使得古DNA基因序列片断比当代DNA更短,导致古DNA测序比当代DNA也要更伟大。不只读取、比对的数据量更大,测序之前还必要去除DNA片断两头的讨论序列,举办数据洗濯与处理赏罚流程。

中国首座考古DNA尝试室怎样解困难?

为了更好地掩护中国基因资源,敦促中华民族基因研究,1998年,吉林大学考古系与生命科学学院相助开展了有关古DNA方面的研究事变,由其中国第一座“考古DNA尝试室”竣工。边疆考古研究中心人类学尝试室与考古DNA尝试室相助攻关重大研究课题,取得了多项世界以致环球领先的研究成就。

探寻五千年汗青变迁,海潮AI加快中国考古DNA研究

跟着DNA考古研究的慢慢深入,考古DNA尝试室已有高出万例的昔人类、古动植物样本,数目位居世界第一,成立我国边疆地域古代DNA基因库的机缘日益成熟。但样本数目增进也带来了新的困难,原有的计较装备已难以在短时刻内完成大量的基因测序数据处理赏罚事变。全基因组样天职析(WGS)与全外显子组样本(WES)说明是今朝DNA研究的不行或缺的两大说明流程。然而,行使当前以CPU为基本的计较架构开拓的GATK Best Practices事变流程,必要数天乃至数周才气完成单个个另外基因组变异辨认。

另外,古DNA基因序列片断更短导致数据处理赏罚量更大,对计较力的要求也更高。数据洗濯、测序进程中,必要用到很是多的差异于当代DNA测序的应用软件,怎样实现这些应用软件的快速移植与开拓也是一大挑衅,影响古DNA的研究速率。

“我们之前一向用台式事变站做古DNA的测序数据处理赏罚,一样平常完成一次昔人类的全基因组样天职析必要耗时至少两周,进程中还要面对宕机带来的处理赏罚流程间断风险。按这种服从,我们要成立边疆地域古代DNA基因库险些是一个不行能完成的使命。”吉林大学边疆考古研究中心副主任蔡大伟传授先容说,“可是,这个题目必需尽快办理,古DNA研究一刻都不能延伸”。

海潮为办理这一困难提供了新思绪,作为中国AI计较的领军企业,海潮专门为基因测序开拓了FPGA加快计较方案,FPGA具有可编程、并行计较、低耽误的上风,可以或许为基因测序、语音辨认、视频处理赏罚、风险打点等AI和HPC场景提供强盛的加快。颠末严苛测试和全面考查,吉林大学考古学院抉择和海潮相助,将FPGA技能运用到古DNA基因测序中,打造我国DNA考古规模的首个FPGA基因测序加快应用方案。

提速39倍 基因测序处理赏罚速率实现奔腾

新的基因测序加快计较方案回收了海潮研发的F10A FPGA加快卡作为焦点计较模块,集成了峰科的GATK基因处理赏罚软件。海潮F10A是今朝业界支持OpenCL的最高密度、最高机能的FPGA加快装备,尺寸为半高半长功耗仅35W,可以合用于数据中心、边沿及桌面等各类伟大计较情形,每瓦特机能到达42GFlops,可以加载专业的软件算法库。集成的峰科的GATK基因处理赏罚软件与尺度生物信息学说明器材完全同等,包罗GATK Best Practices的全部流程,如BWA、picard和GATK。它完全依照原软件模子,挪用呼吁与原版本同等,中间发生与原样本同等的中间功效文件,利便用户行使和调解。

探寻五千年汗青变迁,海潮AI加快中国考古DNA研究

海潮F10A加快卡

测试表现,搭载海潮FPGA基因测序加快计较方案可在9.64 小时内完玉成基因组说明,48分钟完玉成外显子组说明,对比基于CPU的方案,基因数据处理赏罚速率晋升39倍。

今朝,基于新的基因测序加快计较体系,吉林大学考古DNA尝试室的科研事变者正在对我国北方地域的草原游牧民族,如匈奴、东胡、鲜卑、乌桓、契丹、蒙古等诸族的人骨以及出土的动植物举办古DNA的提取和研究事变,并开展我国新疆地域古代“丝绸之路”沿线各民族彼此相关、人群间的迁移及稠浊进程、经济文化糊口、天然情形与人类彼此相关等相干研究,不绝为古代汗青、文化、民族研究提供新的资料,开辟新的规模。如蔡大伟传授及其团队正在攻关国度社会科学基金重大项目“古动物DNA视角下的丝路文化交换研究”,从古动物DNA入手,还原丝路沿线古代动物群体发源与扩散的汗青进程,显现丝绸之路上对象文化交换的汗青细节。

相干阅读:

贵州省人大审议大数据安详保障条例(草案)

数字重庆公司创立 为重庆大数据财富打造三平台    

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读