发布日期:2024-10-29 23:11 点击次数:89
图 使用东谈主工智能对天下病毒圈的深度挖掘情色艺术中心
在国度当然科学基金神态(批准号:82341118、32270160)等资助下,中山大学医学院施莽教育团队、阿里云李兆融团队,劝诱悉尼大学Edward Holmes教育团队,在东谈主工智能(artificial intelligence,AI)算法识别潜在的RNA病毒种(species)及RNA病毒轶群(supergroups)相干方面获得施展。关联着力以“应用东谈主工智能揭示笼罩的RNA病毒圈(Using Artificial Intelligence to Document the Hidden RNA Virosphere)”为题,于2024年10月9日在《细胞》(Cell)杂志在线发表。论文畅达:https://www.cell.com/cell/fulltext/S0092-8674(24)01085-7。
病毒是地球生态系统的进军构成部分,与东谈主类健康关系密切。当今东谈主类对病毒种种性的意识仍然相配有限,当然界病毒圈仍有大齐病毒种类处于未知景象。传统的RNA病毒决然步调高度依赖于序列同源性比对,即通过比拟未知病毒与已知病毒的序列相通性来识别。然则,由于RNA病毒种类迢遥且高度分化,这种步调难以捕捉繁重同源性或同源性极低的病毒序列。若何高效、准确地发现和决然新病毒仍充满挑战。
韩国裸舞相干团队研发了一种应用卵白质序列和结构信息的变换器架构(Transformer)深度学习言语模子“LucaProt”,该模子具有较高的准确性(假阳性率为0.014%)和特异性(假阴性率为1.72%)。进一步,应用“LucaProt”深度挖掘来自天下种种生物环境的10,487份宏转录组数据,发现跳跃51万条病毒基因组,代表跳跃16万个潜在的RNA病毒物种和180个RNA病毒轶群,使现存RNA病毒轶群数目增多了约9倍(图)。其中,23个轶群无法通过传统的同源性分析识别,被称为病毒圈的“暗物资”。这些新发现的病毒来自地球上的种种生态环境,包含南极底泥、深海热泉、活性污泥和盐碱滩等极点环境,权臣拓宽了东谈主们对RNA病毒溜达和符合生境的贯通。此外,该相干还发现迄今驱逐最长的RNA病毒基因组,同期揭示了多种复杂的基因组结构,展示了RNA病毒在基因组进化上的高度机动性。
这项相干将东谈主工智能与病毒基因组发现结合,败坏了传统的病毒分歧和同源性分析步调的局限情色艺术中心,推广了东谈主们对病毒圈的融会。