北鲲云为基果测序数据阐发供给算力基石

2022-11-16 15:47:04 作者:™柠萌う
导读:北鲲云为基因测序数据分析提供算力基石,我国十三五期间对150万人进行了基因组测序,每个人大约产生300-500GB的数据,基因数据总量在十三五末期达到EB级别。而对于宏基因组学...

我国十三五时期对150万人举行了基因组测序,每小我私家约莫孕育发生300-500GB的数据,基因数据总量在十三五末期到达EB级别。而对付宏基因组学,仅1克泥土样品的宏基因组测序就可以孕育发生50TB的原始数据。当前基因组数据正以12-18个月10倍以上的速率增进,远远凌驾了闻名的摩尔定律。

怎样高效处置惩罚大范围基因测序数据是高性能处置惩罚生物信息阐发一定面临的课题,而对大范围的生物信息数据的研究将有助于突破康健医疗、情况污染、新能源等范畴传统要领的限定,为相干行业的进展提供新的办理要领。

基因测序数据阐发必要海量算力的支持

根本的数据处置惩罚和阐发涉及以下四步:第一步,对测序猎取的小引列举行比对拼接;第二步,比对拼接后,举行全基因组基因解释。包罗基因组组分阐发,SNP阐发,编码基因猜测,重复序列解释,Non-codingRNA基因解释,MicroRNA基因解释等;第三步,对猜测的基因举行功效解释;第四步,比力基因组和分子进化阐发,如快速进化阐发、共线性阐发、基因家属阐发等。常用的进化树阐发软件如 MEGA。


在整个历程中,必要用到近百种软件。各个软件资源利用特性又差异很大,比方,拼接软件必要大量的内存斲丧,比对软件则是典范的数据麋集型盘算。庞大的生物信息盘算使得生物测序数据的处置惩罚和阐发必要海量的盘算资源,这对高性能盘算平台提出了更高的要求。

怎样高效举行基因测序数据阐发?

鉴于很多用户受限于内存容量以及相应的盘算本领而不克不及应用于大范围超永生物序列阐发事情,北鲲云提供包罗基因测序数据阐发软件、盘算资源、数据库的团体办理方案,关心用户办理高通量测序所带来的海量生物数据的存储与处置惩罚等题目。用户无需任何编程底子,无需安置庞大的生物信息数据阐发比拟软件,无需下载巨大的生物数据库,只需在图形化界面举行简洁点击操纵,就能在云上搞定基因测序数据阐发。

北鲲云预装了300+行业主流软件以及Genbank、EMBL等常用参考数据库,并提供高性能盘算软件及基于种种MPI的自研软件的安置、摆设、调试办事;峰值盘算本领到达140Pflops,存储容量为10PB,可极大地加速生物测序数据处置惩罚历程,进步研究服从。

数据资源的极速膨胀迫使人们需求一种强有力的东西去阐发这些数据,从海量的生物学数据中需求生物学纪律,这些纪律是解说生命之谜的要害。在这条生命科学的漫漫征程中,北鲲云将紧跟科技的进展和用户需求的改变,连续举行研发迭代升级,陪同生命科学行业一起前行。

除基因测序数据阐发外,北鲲云还提供了卵白折叠、假造筛选、卵白布局模仿、分子动力学模仿等应用场景的高性能盘算办理方案,助力生命科学范畴的研究和进展。

精彩图集