[db:摘要]...
2月19日,美国弧形研讨所、美国芯片制作商英伟达公司跟美国斯坦福年夜学等机构的研讨职员独特开辟的人工智能(AI)生物学模子Evo 2正式宣布。现在,该模子已开放给寰球科研职员,他们可经由过程网页应用该模子,还可收费下载该模子的源代码、练习数据及参数。美国弧形研讨地点其官网宣布公报称,在前一代模子Evo 1的基本上,Evo 2已开展成为现在生物学范畴范围最年夜的AI模子。Evo 1基于8万个细菌、古菌基因组及病毒等序列停止练习,Evo 2则基于超越12.8万个基因组数据的9.3万亿个核苷酸停止练习。这些模子使呆板可能“用核苷酸言语来读、写跟思考”。?据《天然》报道,在从前多少年里,迷信家开辟了日益强盛的“卵白质言语模子”,如美国互联网公司Meta开辟的ESM-3模子。这类模子经由过程练习数百万卵白质序列,已被用于猜测卵白质构造跟计划包含基因编纂东西、荧光分子在内的全新卵白质。与这些模子差别,Evo 2的练习数据既包括领导卵白质分解的“编码序列”,也包括可调控基因运动时空特点的非编码DNA。相较于原核生物,真核基因组平日更长、更庞杂——基来由编码区与非编码区瓜代形成,非编码调控DNA可能阔别其调控的基因。为处置这种庞杂性,Evo 2被计划成能进修百万碱基范畴内的DNA序列形式。为验证该模子剖析庞杂基因组的才能,美国弧形研讨所的生物工程师Patrick Hsu团队应用Evo 2猜测乳腺癌相干基因BRCA1中已知渐变的影响。在相干测试中,Evo 2在猜测哪些渐变是良性渐变、哪些是潜伏致病渐变方面均到达90%以上的正确率。“在断定编码区变异能否致病方面,其表示濒临最佳生物AI模子,已到达顶尖程度。”Hsu表现,Evo 2有助于辨认患者基因组中难以解读的变异。别的,该模子还可用于计划新的生物东西或医治方式,且有助于节俭大批用于细胞或植物试验的时光跟研讨资金,经由过程找到人类疾病的遗传起因来减速新药研发。美国生物模子开辟公司Tatta Bio的盘算生物学家Yunha Wang以为,Evo 2或善于将细菌跟古菌基因组的法则利用于人类新卵白质计划。“卵白质言语模子等AI东西已激发生物计划反动。”斯坦福年夜学的盘算生物学家Brian Hie及共事盼望能用AI建模全部细胞。他们等待Evo-2等基因组模子能够辅助他们获得更年夜冲破。公报夸大称,斟酌到潜伏的伦理跟保险危险,研讨职员在Evo 2的基本数据会合已消除了沾染人类跟其余庞杂生物的病原体,并确保该模子不会对这些病原体的相干查问前往无效谜底。