作者/文龙
重新设计用于催化所需化学反响的卵白质一向是卵白质工程范畴的恒久目的。只管科学家们已经研究数十年之久,但迄今为止,在盘算和试验上均未实现卵白质序列与卵白质功效之间的映射。
近来,立陶宛维尔纽斯大学和瑞典查尔默斯理工大学的研究职员团结开辟了一种天生神经网络,该网络可以处置惩罚和「进修」差别的自然卵白质序列,证明白人工智能快速天生高度多样化的功效卵白的潜力。
相干研究结果于3月4日以「利用天生反抗网络扩展卵白质序列空间」(Expanding functional protein sequence spaces using generative adversarial networks)为题颁发在《天然·呆板智能》(Nature Machine Intelligence)杂志上。
卵白质属于大分子,布局高度庞大,而且可以在全部活的生物体体内发觉。卵白质由氨基酸通过肽键毗连而成,具有多种功效和特性。差别氨基酸分列的特定次序终极决定了卵白质的3D布局、理化性子和分子功效。
另一方面,呆板进修已经证明白在自然卵白质序列中捕捉其布局和进化信息的庞大潜力,但这些要领仅能猜测给定卵白质序列的特性。相比之下,天生性反抗网络(GAN)可以或许绕开庞大的卵白质序列空间的试验筛选,直接从氨基酸序列推测卵白质性子和功效,天生新型功效序列变体。
是以,该团队基于自细致天生性反抗网络(self-attention GAN)开辟了 ProteinGAN。ProteinGAN 可以或许直接从庞大的多维氨基酸序列空间中进修卵白质序列的进化干系,并创建具有自然卵白质雷同物理特性的具有特定功效的新的序列变体。
研究职员对用 ProteinGAN 天生的酶卵白举行了试验,效果表现,ProteinGAN 孕育发生的序列比练习数据中存在的序列多了高达四倍,具有新鲜的布局。经质谱验证,所孕育发生的酶具有特异性,表现出的反响产量和活性程度与对应的自然酶相似。
图示:天生的和天然序列的氨基酸对的相干性。(泉源:论文)
卖力这项研究的查尔默斯理工大学副传授 Aleksej Zelezniak 表现:「受AI最新进展的开导,格外是 GAN 可以天生传神的照片,我们很想知道当前的AI技能是否预备好生产人类已知的最庞大的分子——卵白质。」
ProteinGAN 利用的天生性神经网络基于反抗进修,包管了新孕育发生的高度多样化的卵白质序列具有与自然卵白质序列雷同的物理性子。
反抗进修可以看作是由两小我私家工神经网络「玩耍」的游戏。第一个网络被称为「天生器」,它天生特定范例的数据(比方,图像、文本),ProteinGAN 中的天生数据为卵白质序列。第二个网络称为「鉴别器」,它试图区分由天生器创建的人工数据是否为真实数据。随后,天生器利用鉴别器提供的反馈天生新的数据,直到鉴别器无法辨认天生的数据是人工天生的数据。
图示:ProteinGAN架构。(泉源:论文)
Zelezniak 说:「通过重复地重复这一历程,两个网络都变得更好,直到无法将天生的序列与真实的序列区离开。利用我们开辟的AI东西,我们可以或许天生活泼但不存在或尚未发觉的功效卵白。」
Zelezniak 指出:「从洗衣粉到抗癌以及冠状病毒的治疗要领,卵白质是我们平常生存中常用到的。」但是,创立功能性卵白质序列是一项非常具有挑衅性的使命,由于纵然是给定序列的轻细转变也会使卵白质失去功效。
ProteinGAN 证明白人工智能在序列空间许可的生物学限定内快速天生高度多样化的功效卵白的潜力。未来,ProteinGAN 可以用于发觉具有差别特性的新卵白质序列,这大概对付餍足生物医学和生物技能等范畴的应器具有紧张的代价。
Zelezniak 还表现:「我们试验室的研究专注于基于 AI 技能的人工合成生物应用。我们现在正在高兴办理诸如塑料污染等新显现的题目,我信赖人工智能将有助于创建更好的有机体,以顺应这一特别题目。」
论文链接:http://dx.doi.org/10.1038/s42256-021-00310-5
参考内容:http://phys.org/news/2021-04-proteingan-adversarial-network-functional-protein.html