首頁>檢索頁>當(dāng)前

    中山大學(xué):解鎖“AI+病毒學(xué)”的科學(xué)密碼

    發(fā)布時間:2024-10-18 作者:張梓欣 劉盾 來源:中國教育新聞網(wǎng)

    “通過LucaProt,我們發(fā)現(xiàn)了許多未研究過的病毒群體,以及具有特殊長度、復(fù)雜基因組結(jié)構(gòu)的RNA病毒類型?!敝猩酱髮W(xué)醫(yī)學(xué)院施莽教授團隊從“已知”中尋找“未知”,將人工智能技術(shù)應(yīng)用于病毒鑒定。他們跨越重重技術(shù)難關(guān),發(fā)現(xiàn)了大量全新RNA病毒。

    過去,人們通過分離培養(yǎng)病毒,在顯微鏡下觀察確認(rèn)病毒的存在。隨著技術(shù)發(fā)展,科學(xué)家們利用測序技術(shù),通過比較未知病毒和已知病毒核酸序列的相似性,來識別和鑒定新病毒。然而,這些傳統(tǒng)的病毒發(fā)現(xiàn)方法比較依賴既有知識,尤其在面對缺乏同源性或同源性低的“暗物質(zhì)病毒”時,很容易失靈。

    如何突破傳統(tǒng)病毒發(fā)現(xiàn)方法的瓶頸,用更高效、更精準(zhǔn)的方法去發(fā)現(xiàn)和鑒定新病毒,并進行下游的驗證工作?這是擺在中山大學(xué)研究團隊面前的現(xiàn)實問題。

    2020年起,中山大學(xué)研究團隊開發(fā)了一種基于同源性的生物信息學(xué)算法,它能夠幫助科研人員發(fā)現(xiàn)遠(yuǎn)緣的病毒,但仍面臨著操作煩瑣,以及難以深入探測“暗物質(zhì)病毒”的技術(shù)難關(guān)。2022年,中山大學(xué)研究團隊與阿里云李兆融團隊的一次偶然交流,為發(fā)現(xiàn)“暗物質(zhì)病毒”帶來了契機。此后,兩個團隊展開緊密合作,聯(lián)合開發(fā)用于病毒發(fā)現(xiàn)的人工智能模型。

    合作的初期,中山大學(xué)研究團隊對新興AI模型不熟悉,阿里云的算法工程師們不了解病毒學(xué)。為搭建服務(wù)于病毒鑒定的人工智能模型,雙方不斷為對方普及各自領(lǐng)域的知識。盡管相隔數(shù)千公里,在日常線上溝通的基礎(chǔ)上,他們還經(jīng)?;ハ喟菰L,共同討論問題。

    除溝通問題外,模型優(yōu)化也是一個不小的挑戰(zhàn)。當(dāng)時,中山大學(xué)研究團隊基于蛋白質(zhì)序列數(shù)據(jù)訓(xùn)練模型,經(jīng)過測試后,模型的準(zhǔn)確率能達(dá)到80%以上,但團隊認(rèn)為仍有提升空間。項目相關(guān)負(fù)責(zé)人回憶:“通過進一步討論,我們意識到過去的研究過于依賴序列信息,而忽視了結(jié)構(gòu)信息的重要性?!币虼?,他們更新了模型,在傳統(tǒng)的序列比較基礎(chǔ)上,加入預(yù)測的蛋白質(zhì)結(jié)構(gòu)信息。這樣的改進大幅提升了區(qū)分RNA病毒的準(zhǔn)確性和效率。

    反復(fù)優(yōu)化模型后,LucaProt人工智能算法能夠?qū)Σ《竞头遣《净蚪M序列深度學(xué)習(xí),且能在數(shù)據(jù)集中后,自主判斷病毒序列。“與傳統(tǒng)方法相比,LucaProt結(jié)合了序列和預(yù)測結(jié)構(gòu)信息,在準(zhǔn)確性、效率以及檢測病毒多樣性方面,展現(xiàn)出了很大優(yōu)勢。”項目相關(guān)負(fù)責(zé)人介紹,LucaProt人工智能算法專為RNA病毒發(fā)現(xiàn)而設(shè)計,其框架融合了蛋白質(zhì)序列與隱含的結(jié)構(gòu)信息??蒲腥藛T輸入蛋白質(zhì)序列,就可以對該序列進行判別。

    “人工智能的速度和精度可以幫助科學(xué)家更快地鎖定潛在病原體,而這種能力在疾病防控和新病原的快速識別中尤為重要?!痹谑┟Э磥恚斯ぶ悄苁且晃弧昂弥帧?。

    在來自全球生物環(huán)境樣本的10487份RNA測序數(shù)據(jù)中,研究團隊利用這套算法,發(fā)現(xiàn)了超過51萬條病毒基因組,代表超過16萬個潛在病毒種及180個RNA病毒超群,使RNA病毒超群數(shù)量擴容約9倍。其中23個超群無法通過序列同源方法識別,被稱為病毒圈的“暗物質(zhì)”。

    新病毒的發(fā)現(xiàn),刷新著科學(xué)家對病毒圈的認(rèn)識。通過進一步分析,團隊報告了迄今最長的RNA病毒基因組,長度達(dá)到47250個核苷酸,并發(fā)現(xiàn)了超出以往認(rèn)知的基因組結(jié)構(gòu),展現(xiàn)出RNA病毒基因組進化的靈活性。項目相關(guān)負(fù)責(zé)人表示,LucaProt在未來將成為重要的病毒鑒定工具。隨著病毒數(shù)據(jù)積累得越來越多,研究團隊可以在此基礎(chǔ)上開展增量訓(xùn)練,進一步發(fā)現(xiàn)更多缺乏序列同源性的“暗物質(zhì)病毒”。

    “病毒的多樣性遠(yuǎn)超人類想象,我們目前所看到的仍是冰山一角?!痹谑┟Э磥?,團隊的研究展示了病毒多樣性的深度,但廣度仍有待更多樣本的補充。(中國教育報-中國教育新聞網(wǎng)通訊員 張梓欣 記者 劉盾)

    0 0 0 0
    分享到:

    相關(guān)閱讀

    最新發(fā)布
    熱門標(biāo)簽
    點擊排行
    熱點推薦

    工信部備案號:京ICP備05071141號

    互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024

    中國教育報刊社主辦 中國教育新聞網(wǎng)版權(quán)所有,未經(jīng)書面授權(quán)禁止下載使用

    Copyright@2000-2022 www.cellautomata.net All Rights Reserved.

    京公網(wǎng)安備 11010802025840號

    免费一级做a爰片久久毛片潮,中文字幕高清无码18勿进,免费老熟妇牲交大全视频中文,国产一级 片内射视频播放