從中國(guó)科大獲悉,該校微尺度物質(zhì)科學(xué)國(guó)家研究中心江俊教授與其合作者合作,通過(guò)利用人工智能機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)技術(shù),模擬了蛋白質(zhì)肽鍵結(jié)構(gòu)與性質(zhì)之間的構(gòu)效關(guān)系,大大降低了計(jì)算量,為預(yù)測(cè)蛋白質(zhì)的光學(xué)特性提供了一種高效的工具。相關(guān)成果日前發(fā)表在《美國(guó)科學(xué)院院報(bào)》上。
蛋白質(zhì)的光譜響應(yīng)信號(hào),尤其是紫外光譜,可以稱(chēng)之為蛋白質(zhì)骨架的“指紋”。這個(gè)“光學(xué)指紋”,經(jīng)過(guò)理論模擬的解讀,可以揭示出精確的蛋白質(zhì)結(jié)構(gòu),為生命科學(xué)和醫(yī)學(xué)診斷提供極其重要的信息。
然而,蛋白質(zhì)的結(jié)構(gòu)極其復(fù)雜多變,需要做大量的高精度的量子化學(xué)理論計(jì)算。由于計(jì)算量太大,即使是最厲害的超級(jí)計(jì)算機(jī)也“吃不消”。所以蛋白質(zhì)光譜的理論解讀是一個(gè)長(zhǎng)期的困難與挑戰(zhàn),限制了光譜的準(zhǔn)確分析和蛋白質(zhì)結(jié)構(gòu)的發(fā)現(xiàn)。
研究人員首先在300K溫度下通過(guò)分子動(dòng)力學(xué)模擬以及量子化學(xué)計(jì)算,得到了五萬(wàn)組不同構(gòu)型的肽鍵模型分子。通過(guò)機(jī)器學(xué)習(xí)算法篩選出鍵長(zhǎng)、鍵角,二面角跟電荷信息作為描述符,通過(guò)神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建肽鍵基態(tài)結(jié)構(gòu)與其激發(fā)態(tài)性質(zhì)之間的構(gòu)效關(guān)系?;谟?xùn)練好的機(jī)器學(xué)習(xí)模型,預(yù)測(cè)出了肽鍵的基態(tài)偶極矩及激發(fā)態(tài)性質(zhì),最后預(yù)測(cè)出肽鍵的紫外吸收光譜。為了驗(yàn)證機(jī)器學(xué)習(xí)模型的魯棒性,研究人員又基于300K的溫度下得到的機(jī)器學(xué)習(xí)模型,預(yù)測(cè)出肽鍵在200K以及400K溫度下的紫外吸收光譜,其結(jié)果與時(shí)間密度泛函理論計(jì)算結(jié)果達(dá)到很好的吻合。
這是人工智能技術(shù)首次用于理論計(jì)算預(yù)測(cè)蛋白質(zhì)的光譜研究。通過(guò)理論計(jì)算得到大量數(shù)據(jù),使用人工智能加以訓(xùn)練后,確立了機(jī)器學(xué)習(xí)模擬蛋白質(zhì)肽鍵骨架紫外吸收光譜的可行性和優(yōu)勢(shì),蛋白質(zhì)的“光學(xué)指紋”解讀也將會(huì)變得更加輕易和有效。