機器學習模型助力探尋新冠病毒新變種
新華社北京5月29日電 《參考消息》29日登載阿根廷布宜諾斯艾利斯經濟新聞網報道。報道摘要如下:
麻省理工學院-哈佛大學布羅德研究所以及美國馬薩諸塞大學醫學院的科學家開發了一種機器學習模型,可以分析來自新冠病毒樣本的數百萬個基因組,并預測哪些病毒變體將占主導地位并可能引發新的浪潮。該模型被稱為PyR0,可以幫助研究人員確定病毒基因組的哪些部分最不可能發生突變,從而為可對抗未來變體的疫苗提供目標。研究結果日前發表在美國《科學》周刊上。
研究人員使用截至2022年1月在流感數據共享全球倡議數據庫中的600萬個新冠病毒基因組訓練了機器學習模型。
自新冠大流行開始以來,世界各地的研究人員一直致力于預測新冠病毒不同變體的適應性。但以前的模型無法同時比較所有變體,或者僅處理幾千個基因組就需要數天時間。
相反,PyR0可以在大約1小時內分析數百萬個基因組——所有公開可用的新冠病毒數據。它將相似的序列組合在一起,并通過它們共享的突變群來定義基因組的“組別”。通過聚焦可能出現在多個變體中的突變,PyR0比僅關注病毒變體的模型具有更強大的統計能力。
隨后,該模型可以確定哪些突變將越來越普遍,并估計每種突變導致病毒傳播的速度。它還可根據其基因組成估計不同變體的病例數量增加的速度。
通過確定哪些突變對哪些變體的適應性很重要,該模型還提供了關于新冠病毒如何傳播和發展的生物學觀點。例如,了解關鍵突變可以幫助科學家預測新變體是否更具傳染性或更能逃避中和抗體,還可以幫助他們決定要更詳細地研究哪些突變。
(責任編輯:歐云海)