文 | 學(xué)術(shù)頭條,作者 |朱哼哼,編輯 | 王新凱
結(jié)構(gòu)生物學(xué)領(lǐng)域有一個(gè)非常經(jīng)典的口頭禪,即結(jié)構(gòu)決定功能。
對(duì)于現(xiàn)代生物學(xué)和新藥研究來說,確定生物大分子的三維結(jié)構(gòu)對(duì)于其功能理解,新藥開發(fā)具有重要意義。然而,在科技高度發(fā)達(dá)的今天,各大科研機(jī)構(gòu)和藥企往往需要耗費(fèi)數(shù)百萬美元的資金來確定某個(gè)生物大分子的結(jié)構(gòu),且經(jīng)常失敗。
尤其是在 RNA 領(lǐng)域,目前人類對(duì)于 RNA 分子三維立體結(jié)構(gòu)的認(rèn)知仍舊處于起步階段。加州大學(xué)歐文分校化學(xué)家 Robert Spitale 也曾說過,“我們對(duì)大部分RNA的結(jié)構(gòu)幾乎一無所知?!?/strong>
而現(xiàn)在,人們終于在 RNA 三維結(jié)構(gòu)領(lǐng)域取得了突破性進(jìn)展。
近日,美國(guó)斯坦福大學(xué)在讀博士生 Stephan Eismann 和 Raphael Townshend 在計(jì)算機(jī)副教授 Ron Dror 的指導(dǎo)下,利用目前先進(jìn)的神經(jīng)網(wǎng)絡(luò)技術(shù),成功開發(fā)出了一種全新 RNA 三維結(jié)構(gòu)預(yù)測(cè)模型——ARES。
(來源:Science)
與其他傳統(tǒng) AI 算法不同,ARES 的結(jié)構(gòu)框架并不是針對(duì) RNA 結(jié)構(gòu)設(shè)計(jì),而是針對(duì)原子結(jié)構(gòu)設(shè)計(jì)的。通過不斷調(diào)整參數(shù),ARES 可以深入了解 RNA 上每個(gè)原子之間的相對(duì)位置以及幾何排列,進(jìn)而推算出 RNA 最佳三維幾何結(jié)構(gòu),其準(zhǔn)確性遠(yuǎn)超傳統(tǒng)方法。
對(duì)于這一研究結(jié)果,Eismann 博士表示,“傳統(tǒng) RNA 三維結(jié)構(gòu)預(yù)測(cè)模型主要針對(duì) RNA 結(jié)構(gòu)設(shè)計(jì),這樣設(shè)計(jì)的算法得出的結(jié)構(gòu)更傾向于 AI 訓(xùn)練時(shí)所使用的 RNA 結(jié)構(gòu),由于目前人們對(duì) RNA 三維結(jié)構(gòu)了解并不多,因此這類算法并不準(zhǔn)確。而我們更傾向于從原子結(jié)構(gòu)出發(fā),讓系統(tǒng)自己去尋找 RNA 的空間結(jié)構(gòu),因此它能更好地發(fā)現(xiàn)我們此前未知的結(jié)構(gòu)。”
圖 | 最新一期 Science 封面
該研究以“Geometric deep learning of RNA structure”為題,發(fā)表在最新一期的?Science?雜志上。
自 1953 年 DNA 雙螺旋結(jié)構(gòu)發(fā)現(xiàn)至今的幾十年來,生命科學(xué)的舞臺(tái)一直被 DNA 和蛋白質(zhì)霸占。DNA 負(fù)責(zé)遺傳信息存儲(chǔ),蛋白質(zhì)負(fù)責(zé)基因指令執(zhí)行,而 RNA 不過是中間環(huán)節(jié)的傳遞者。
正是基于蛋白質(zhì)領(lǐng)域的諸多發(fā)現(xiàn),科學(xué)家們成功制造出了胰島素、干擾素以及各種新型抗癌藥物等先進(jìn)的醫(yī)學(xué)成果。同時(shí),通過改造 DNA,科學(xué)家門也在基因療法治療血友病、遺傳學(xué)失明以及其他疑難雜癥上取得了長(zhǎng)足的進(jìn)步。
然而,人類過去在生物醫(yī)藥領(lǐng)域的征途中,一直忽略了 RNA 分子的存在。雖然,科學(xué)家很早就知道 RNA 參與了幾乎所有的細(xì)胞過程,但是由于 RNA 的結(jié)構(gòu)不如 DNA 穩(wěn)定,長(zhǎng)期以來 RNA 一直被當(dāng)做配角,籠罩在 DNA 和蛋白質(zhì)的光芒之下。
(來源:Pixabay)
當(dāng)然,生物學(xué)家現(xiàn)在已經(jīng)知道,人類基因組 85%能轉(zhuǎn)錄成 RNA,但大部分 RNA 并不會(huì)翻譯成蛋白質(zhì),而是擁有多種多樣功能的調(diào)節(jié)分子,RNA 不僅傳遞蛋白質(zhì)合成的遺傳信息,也是控制基因活性和調(diào)節(jié)其他 RNA 功能的重要因素。
而 RNA 藥物的出現(xiàn),顛更是覆了傳統(tǒng)藥物研發(fā)的邏輯思路。從理論上講,只要知道致病基因的序列,設(shè)計(jì)與致病序列互補(bǔ)的 RNA,即可從源頭控制致病蛋白的翻譯表達(dá),以達(dá)到治療疾病的目的。以 RNA 作為靶點(diǎn),可以極大地豐富了藥物靶點(diǎn)的選擇,為藥物研發(fā)帶來新的變革。
因此,近年來,越來越多的研究者和商業(yè)團(tuán)體將目光投向了 RNA 療法。RNA 開始作為治療藥物引領(lǐng)現(xiàn)在生物醫(yī)藥的浪潮,未來有望和抗體、小分子抑制劑一樣,成為生物醫(yī)藥領(lǐng)域最閃耀的新星。
序列決定結(jié)構(gòu),結(jié)構(gòu)決定功能,這是 RNA 和蛋白質(zhì)這樣的生物大分子的基本法則。這也是為什么科學(xué)家熱衷于研究這些生物分子機(jī)器精細(xì)結(jié)構(gòu)的深層原因,因?yàn)?strong>只有知道了結(jié)構(gòu)才能知道功能背后的原理。
長(zhǎng)期以來,科學(xué)家對(duì) RNA 復(fù)雜多樣的結(jié)構(gòu)并不十分了解。DNA 是能預(yù)測(cè)的雙螺旋結(jié)構(gòu),RNA 與 DNA 不同,是單鏈折疊成的隆起、假結(jié)、頭樣、發(fā)夾等多種多樣的復(fù)雜三維循環(huán)結(jié)構(gòu)。滿足不同功能狀態(tài)的需要,不同折疊能相互轉(zhuǎn)化??茖W(xué)家對(duì) RNA 的上述信息了解非常膚淺,這也是目前 RNA 功能研究中最薄弱的環(huán)節(jié)。
近年來,科學(xué)家開始對(duì) RNA 結(jié)構(gòu)研究發(fā)起挑戰(zhàn)。Bevilacqua, Weissman 等設(shè)計(jì)的技術(shù)能對(duì)細(xì)胞內(nèi)大量 RNA 結(jié)構(gòu)進(jìn)行整體解析,初步研究結(jié)果發(fā)現(xiàn),活細(xì)胞內(nèi) RNA 折疊方式與人工條件下的完全不同。
圖 | RNA 3D 結(jié)構(gòu)測(cè)定與分析(來源:NIH)
RNA 分子通常有一個(gè)線性核苷酸鏈,但在細(xì)胞核內(nèi)合成后,會(huì)通過自身核苷酸配對(duì)迅速折疊,然后進(jìn)一步折疊成復(fù)雜三維結(jié)構(gòu),與蛋白和其他 RNA 分子發(fā)生相互作用時(shí)會(huì)改變形狀。
研究 RNA 結(jié)構(gòu)的大部分技術(shù)利用核苷酸相互結(jié)合的特點(diǎn),或者序列對(duì)某些酶的敏感性。計(jì)算機(jī)模擬技術(shù)也有助于整體結(jié)構(gòu)的分析。但是這些方法非常繁瑣,一次只能分析一個(gè)分子的一部分。
因此,雖然越來越多的證據(jù)表明,從細(xì)菌到人類功能性 RNA 無處不在,理論上靶向 RNA 可以治療人類任何疾病,但是由于無法準(zhǔn)確獲得 RNA 的三維結(jié)構(gòu),有關(guān) RNA 的基礎(chǔ)研究和藥物拓展一直受阻。
預(yù)測(cè)蛋白質(zhì)復(fù)合物以及 RNA 三維空間結(jié)構(gòu)是生物化學(xué)領(lǐng)域一項(xiàng)巨大的挑戰(zhàn),對(duì)于基礎(chǔ)科學(xué)和藥物研發(fā)具有重大的意義。Stephan Eismann 博士等人致力于相關(guān)的研究。
以往蛋白質(zhì)復(fù)合物以及 RNA 等生物大分子結(jié)構(gòu)人工智能預(yù)測(cè)模型通常會(huì)直接利用給定的結(jié)構(gòu)特征來進(jìn)行訓(xùn)練。然而,在研究過程中,人們發(fā)現(xiàn),這種利用上述方法開發(fā)出的模型預(yù)測(cè)結(jié)果往往偏向于模型訓(xùn)練時(shí)喂養(yǎng)結(jié)構(gòu)的特征。因此,即使科學(xué)家努力試圖對(duì)模型進(jìn)行優(yōu)化,但是預(yù)測(cè)的準(zhǔn)確性依舊十分有限。
為了準(zhǔn)確預(yù)測(cè)蛋白質(zhì)復(fù)合物以及 RNA 等生物大分子的三維結(jié)構(gòu),Eismann 博士等人換了一個(gè)角度思考,即能否直接利用人工智能學(xué)習(xí)上述生物大分子原子水平的結(jié)構(gòu),以提高預(yù)測(cè)結(jié)果的準(zhǔn)確性。
為此,研究人員基于深度學(xué)習(xí)網(wǎng)絡(luò)開發(fā)了一種全新的人工智能模型,ARES。與其他模型不同,ARES 旨在準(zhǔn)確了解生物大分子中每個(gè)原子的準(zhǔn)確位置和幾何排列,以及不同原子之間的相對(duì)位置。
圖 | ARES 模型(來源:Science)
早在 2020 年的時(shí)候,Eismann 博士等人就曾利用這一理論成功開發(fā)出了一種準(zhǔn)確預(yù)測(cè)蛋白質(zhì)復(fù)合物三維結(jié)構(gòu)的模型,相關(guān)研究發(fā)表在?Proteins?雜志上。
而在本研究中,Eismann 博士等人繼續(xù)對(duì) ARES 進(jìn)行了優(yōu)化。研究人員采用原子坐標(biāo)作為輸入數(shù)據(jù),而不包含 RNA 結(jié)構(gòu)的空間特征。通過不斷調(diào)整參數(shù),ARES 首先了解每個(gè)原子的功能和空間排列,隨后識(shí)別堿基配對(duì)規(guī)則、RNA 螺旋最佳幾何形狀以及三維空間結(jié)構(gòu)。
圖 | ARES 可以準(zhǔn)確識(shí)別出正確的 RNA 分子 3D 形狀(來源:斯坦福大學(xué)官網(wǎng))
最終,研究人員僅用了 18 個(gè)已知 RNA 三維結(jié)構(gòu),就成功訓(xùn)練出了 ARES。在隨后的研究中,Eismann 博士等人證實(shí),ARES 雖然僅由 18 個(gè) RNA 結(jié)構(gòu)訓(xùn)練而來,但是它同樣可以準(zhǔn)確預(yù)測(cè)其他復(fù)雜 RNA 的三維空間結(jié)構(gòu),且準(zhǔn)確性均顯著優(yōu)于既往的模型。
對(duì)此,Dror 教授表示,“人工智能近年來取得的重大突破均需要大量的數(shù)據(jù)訓(xùn)練,而 ARES 在訓(xùn)練數(shù)據(jù)如此少的情況下也取得了成功,這一思路為未來數(shù)據(jù)稀缺領(lǐng)域的科學(xué)研究提供新的解決方案。
參考資料:
更多精彩內(nèi)容,關(guān)注鈦媒體微信號(hào)(ID:taimeiti),或者下載鈦媒體App
2022-09-14 鈦媒體 App發(fā)布了 《星巴克加碼中國(guó)市場(chǎng),未來三年要新增開3000家門店|鈦快訊》的文章
2022-08-11 鈦媒體 App發(fā)布了 《白云山麾下公司虛抬藥價(jià)“把戲”,被拆穿了》的文章
2022-07-06 鈦媒體 App發(fā)布了 《為了幫00后卷王找到工作,簡(jiǎn)歷修改師們拼了》的文章
2022-07-06 鈦媒體 App發(fā)布了 《威尼斯向游客收“進(jìn)城費(fèi)”,國(guó)內(nèi)城市如何借鑒?》的文章
2022-03-25 鈦媒體 App發(fā)布了 《蔚來2021年財(cái)報(bào)發(fā)布:年?duì)I收361億元,整車毛利率達(dá)到20.1%》的文章