2024年11月,Google DeepMind發(fā)布報(bào)告《A new golden age of discovery:Seizing the AI for Science Opportunity》。
這份報(bào)告揭示出:全球?qū)嶒?yàn)室 AI 使用正在指數(shù)級(jí)增長(zhǎng),AI for Science真正的黃金時(shí)代即將來(lái)臨。
其中還提到了五個(gè)能夠利用 AI 來(lái)促進(jìn)科研的機(jī)遇,包括知識(shí)、數(shù)據(jù)、實(shí)驗(yàn)、模型、解決方案。
DeepMind成立于2010年,以突破性成果聞名,包括在圍棋領(lǐng)域擊敗頂級(jí)棋手的AlphaGo、預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的AlphaFold,以及在氣候預(yù)測(cè)和基因研究等領(lǐng)域的創(chuàng)新應(yīng)用。
它以多學(xué)科合作為核心,注重技術(shù)的安全性和社會(huì)責(zé)任,目標(biāo)是讓AI成為解決全球性挑戰(zhàn)的關(guān)鍵力量,為人類創(chuàng)造更美好的未來(lái)。
以下為《報(bào)告》原文:
引言
在全球各地的實(shí)驗(yàn)室中,一場(chǎng)靜悄悄的革命正在醞釀之中,科學(xué)家使用人工智能(AI)的情況正呈指數(shù)級(jí)增長(zhǎng)?,F(xiàn)在,三分之一的博士后研究人員使用大型語(yǔ)言模型來(lái)幫助進(jìn)行文獻(xiàn)回顧、編碼和編輯工作。在10月份,我們的AlphaFold 2系統(tǒng)的創(chuàng)造者Demis Hassabis和John Jumper因使用AI預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)而與科學(xué)家David Baker一同成為了諾貝爾化學(xué)獎(jiǎng)得主,后者的工作是設(shè)計(jì)新蛋白質(zhì)。隨著AI幫助設(shè)計(jì)的藥物和材料正在開(kāi)發(fā)中,社會(huì)很快將更直接地感受到這些好處。
在這篇文章中,我們將探討AI如何轉(zhuǎn)變從基因組學(xué)到計(jì)算機(jī)科學(xué)再到天氣預(yù)報(bào)的科學(xué)學(xué)科。一些科學(xué)家正在訓(xùn)練他們自己的AI模型,而另一些則在微調(diào)現(xiàn)有的AI模型,或者使用這些模型的預(yù)測(cè)來(lái)加速他們的研究??茖W(xué)家們將AI作為一種科學(xué)工具來(lái)幫助解決重要問(wèn)題,例如設(shè)計(jì)更緊密地結(jié)合疾病靶點(diǎn)的蛋白質(zhì),但同時(shí)他們也在逐漸改變科學(xué)本身的實(shí)踐方式。
科學(xué)家擁抱AI的背后有一個(gè)日益增長(zhǎng)的迫切性。近幾十年來(lái),科學(xué)家們繼續(xù)取得重大進(jìn)展,從Covid-19疫苗到可再生能源。但實(shí)現(xiàn)這些突破所需的研究人員數(shù)量越來(lái)越多,并且將這些突破轉(zhuǎn)化為下游應(yīng)用。因此,盡管過(guò)去半個(gè)世紀(jì)以來(lái)科學(xué)勞動(dòng)力顯著增長(zhǎng),僅在美國(guó)就增長(zhǎng)了七倍以上,我們預(yù)期隨之而來(lái)的社會(huì)進(jìn)步卻放緩了。例如,世界許多地區(qū)都經(jīng)歷了生產(chǎn)率增長(zhǎng)的持續(xù)放緩,這削弱了公共服務(wù)的質(zhì)量。朝著2030年可持續(xù)發(fā)展目標(biāo)的進(jìn)展,這些目標(biāo)涵蓋了健康、環(huán)境等方面最大的挑戰(zhàn),正在停滯。
特別是,今天的科學(xué)家在尋求突破時(shí)越來(lái)越多地遇到與規(guī)模和復(fù)雜性相關(guān)的挑戰(zhàn),從他們需要掌握的日益增長(zhǎng)的文獻(xiàn)基礎(chǔ),到他們想要運(yùn)行的日益復(fù)雜的實(shí)驗(yàn)。現(xiàn)代深度學(xué)習(xí)方法特別適合這些規(guī)模和復(fù)雜性的挑戰(zhàn),并且可以壓縮未來(lái)科學(xué)進(jìn)步所需的時(shí)間。例如,在結(jié)構(gòu)生物學(xué)中,單次X射線晶體學(xué)實(shí)驗(yàn)確定蛋白質(zhì)結(jié)構(gòu)可能需要數(shù)年的工作,并且根據(jù)蛋白質(zhì)的不同,成本大約為10萬(wàn)美元。AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)現(xiàn)在免費(fèi)提供即時(shí)訪問(wèn)2億個(gè)預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)。
AI對(duì)科學(xué)的潛在好處并不是有保證的。已經(jīng)有一部分科學(xué)家使用基于LLM(大型語(yǔ)言模型)的工具來(lái)協(xié)助日常任務(wù),例如編碼和編輯,但使用以AI為中心的研究方法的科學(xué)家比例要低得多,盡管這個(gè)比例正在迅速上升。在急于使用AI的過(guò)程中,一些早期的科學(xué)用例的影響值得懷疑。政策制定者可以幫助加速AI的使用,并將其引導(dǎo)向更高影響的領(lǐng)域。美國(guó)能源部、歐盟委員會(huì)、英國(guó)皇家學(xué)會(huì)和美國(guó)國(guó)家科學(xué)院等機(jī)構(gòu)最近都認(rèn)識(shí)到了AI for Science的機(jī)會(huì)。但迄今為止,還沒(méi)有哪個(gè)國(guó)家制定了全面的戰(zhàn)略來(lái)實(shí)現(xiàn)它。
我們希望我們的文章能夠?yàn)檫@樣的戰(zhàn)略提供信息。它的目標(biāo)是那些制定和影響科學(xué)政策以及資金決策的人。我們首先確定了5個(gè)越來(lái)越需要使用AI的機(jī)遇領(lǐng)域,并檢查了在這些領(lǐng)域取得突破所需的主要要素。然后,我們探討了使用AI在科學(xué)中最常見(jiàn)的風(fēng)險(xiǎn),例如對(duì)科學(xué)創(chuàng)造力和可靠性的風(fēng)險(xiǎn),并認(rèn)為AI最終可以在每個(gè)領(lǐng)域都是凈有益的。我們以四個(gè)公共政策理念結(jié)束,幫助迎接一個(gè)新的AI賦能科學(xué)的黃金時(shí)代。
在整個(gè)文章中,我們借鑒了來(lái)自我們自己的AI for Science項(xiàng)目以及外部專家的二十多位專家的見(jiàn)解。文章自然反映了我們作為一個(gè)私營(yíng)部門(mén)實(shí)驗(yàn)室的觀點(diǎn),但我們相信我們提出的論點(diǎn)對(duì)整個(gè)科學(xué)界都是相關(guān)的。我們希望讀者通過(guò)分享他們對(duì)最重要的AI for Science機(jī)會(huì)、要素、風(fēng)險(xiǎn)和政策理念的看法來(lái)做出回應(yīng)。
Part A: 機(jī)遇
科學(xué)家的目標(biāo)是理解、預(yù)測(cè)和影響自然和社會(huì)世界的運(yùn)作,以激發(fā)和滿足好奇心,并解決社會(huì)面臨的重大問(wèn)題。技術(shù)和方法,如顯微鏡、X射線衍射和統(tǒng)計(jì)學(xué),既是科學(xué)的產(chǎn)物,也是推動(dòng)科學(xué)進(jìn)步的工具。在過(guò)去的一個(gè)世紀(jì)中,科學(xué)家越來(lái)越依賴這些工具來(lái)進(jìn)行實(shí)驗(yàn)和推進(jìn)理論。計(jì)算工具和大規(guī)模數(shù)據(jù)分析變得尤為重要,使得從發(fā)現(xiàn)希格斯玻色子到繪制人類基因組圖譜成為可能。從某種角度看,科學(xué)家越來(lái)越多地使用人工智能是這一長(zhǎng)期趨勢(shì)的邏輯延伸。但它也可能標(biāo)志著更為深刻的變化——科學(xué)能力極限的不連續(xù)躍升。
與其列出所有可能使用AI的領(lǐng)域,我們強(qiáng)調(diào)了五個(gè)我們認(rèn)為有使用AI的迫切需要的機(jī)會(huì)。這些機(jī)會(huì)跨越學(xué)科,并解決科學(xué)家在科學(xué)過(guò)程中的不同點(diǎn)越來(lái)越多地面臨的與規(guī)模和復(fù)雜性相關(guān)的具體瓶頸,從生成有力的新假設(shè)到與世界分享他們的工作。
1. 知識(shí)
改變科學(xué)家笑話和傳播知識(shí)的方式
為了做出新發(fā)現(xiàn),科學(xué)家需要掌握不斷增長(zhǎng)且日益專業(yè)化的現(xiàn)有知識(shí)體系。這種“知識(shí)負(fù)擔(dān)”有助于解釋為什么做出變革性發(fā)現(xiàn)的科學(xué)家越來(lái)越年長(zhǎng)、跨學(xué)科,并且位于精英大學(xué),以及為什么個(gè)人或小團(tuán)隊(duì)撰寫(xiě)的論文比例正在下降,盡管小團(tuán)隊(duì)通常更有可能推進(jìn)顛覆性的科學(xué)思想。在分享他們的研究成果方面,已經(jīng)有了一些受歡迎的創(chuàng)新,如預(yù)印本服務(wù)器和代碼庫(kù),但大多數(shù)科學(xué)家仍然以密集、充滿行話、僅限英文的論文形式分享他們的發(fā)現(xiàn)。這可能會(huì)阻礙而不是激發(fā)對(duì)科學(xué)家工作的興趣,包括來(lái)自政策制定者、企業(yè)和公眾的興趣。
科學(xué)家已經(jīng)開(kāi)始使用LLM(大型語(yǔ)言模型)和基于LLM的早期科學(xué)助手來(lái)幫助解決這些挑戰(zhàn),例如通過(guò)綜合文獻(xiàn)中最相關(guān)的見(jiàn)解。在一個(gè)早期的演示中,我們的科學(xué)團(tuán)隊(duì)使用我們的Gemini LLM在一天之內(nèi)從20萬(wàn)篇論文中最相關(guān)的子集中找到、提取和填充特定數(shù)據(jù)。隨著對(duì)更多科學(xué)數(shù)據(jù)的微調(diào)、長(zhǎng)上下文窗口和引用使用的進(jìn)展,這些能力將穩(wěn)步提高。正如我們下面將要展開(kāi)的,這些機(jī)會(huì)并非沒(méi)有風(fēng)險(xiǎn)。但它們提供了一個(gè)窗口,可以從根本上重新思考某些科學(xué)任務(wù),例如在一個(gè)科學(xué)家可以使用LLM幫助批評(píng)它、為不同受眾定制其含義或?qū)⑵滢D(zhuǎn)換為“交互式論文”或音頻指南的世界中,“閱讀”或“編寫(xiě)”科學(xué)論文意味著什么。
2. 數(shù)據(jù)
生成、提取和注釋大模型科學(xué)數(shù)據(jù)集
盡管流行的說(shuō)法是數(shù)據(jù)泛濫的時(shí)代,但大多數(shù)自然和社會(huì)世界的科學(xué)數(shù)據(jù)都存在長(zhǎng)期的缺乏,從土壤、深海和大氣到非正規(guī)經(jīng)濟(jì)。AI可以在不同的方式上提供幫助。它可以使現(xiàn)有的數(shù)據(jù)收集更準(zhǔn)確,例如通過(guò)減少測(cè)序DNA、檢測(cè)樣本中的細(xì)胞類型或捕獲動(dòng)物聲音時(shí)可能發(fā)生的噪聲和錯(cuò)誤。科學(xué)家還可以利用LLM在圖像、視頻和音頻上日益增長(zhǎng)的能力,提取埋藏在科學(xué)出版物、檔案和不太明顯的資源(如指導(dǎo)視頻)中的非結(jié)構(gòu)化科學(xué)數(shù)據(jù),并將其轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)集。
AI還可以幫助用科學(xué)家需要的支持信息注釋科學(xué)數(shù)據(jù),以便使用它。例如,至少有三分之一的微生物蛋白質(zhì)沒(méi)有可靠地注釋其被認(rèn)為執(zhí)行的功能。在2022年,我們的研究人員使用AI預(yù)測(cè)蛋白質(zhì)的功能,導(dǎo)致UniProt、Pfam和InterPro數(shù)據(jù)庫(kù)中出現(xiàn)了新條目。
一旦驗(yàn)證,AI模型也可以作為新的合成科學(xué)數(shù)據(jù)的來(lái)源。例如,我們的AlphaProteo蛋白質(zhì)設(shè)計(jì)模型訓(xùn)練于超過(guò)1億個(gè)由AlphaFold 2生成的AI蛋白質(zhì)結(jié)構(gòu),以及來(lái)自蛋白質(zhì)數(shù)據(jù)銀行的實(shí)驗(yàn)結(jié)構(gòu)。這些AI機(jī)會(huì)可以補(bǔ)充并增加其他非常需要的努力來(lái)生成科學(xué)數(shù)據(jù),如數(shù)字化檔案,或資助新的數(shù)據(jù)捕獲技術(shù)和方法,如正在進(jìn)行的單細(xì)胞基因組學(xué)努力,以創(chuàng)建個(gè)體細(xì)胞的強(qiáng)大數(shù)據(jù)集,細(xì)節(jié)前所未有。
3. 實(shí)驗(yàn)
模擬、加速個(gè)通知復(fù)雜實(shí)驗(yàn)
許多科學(xué)實(shí)驗(yàn)昂貴、復(fù)雜且緩慢。有些實(shí)驗(yàn)根本沒(méi)有發(fā)生,因?yàn)檠芯咳藛T無(wú)法獲得他們所需的設(shè)施、參與者或輸入。聚變就是一個(gè)例子。它承諾了一種幾乎無(wú)限的、無(wú)排放的能源,并且可能使得能源密集型的創(chuàng)新規(guī)模化,如海水淡化。要實(shí)現(xiàn)聚變,科學(xué)家需要?jiǎng)?chuàng)造和控制等離子體——物質(zhì)的第四種基本狀態(tài)。然而,所需的設(shè)施極其復(fù)雜,難以建造。ITER的原型托卡馬克反應(yīng)堆于2013年開(kāi)始建設(shè),但等離子體實(shí)驗(yàn)最早要到2030年代中期才開(kāi)始,盡管其他人希望在更短的時(shí)間內(nèi)建造更小的反應(yīng)堆。
AI可以幫助模擬聚變實(shí)驗(yàn),并使隨后的實(shí)驗(yàn)時(shí)間使用更加高效。一種方法是在物理系統(tǒng)的模擬上運(yùn)行強(qiáng)化學(xué)習(xí)代理。在2019年至2021年之間,我們的研究人員與洛桑聯(lián)邦理工學(xué)院合作,展示了如何使用RL控制模擬的托卡馬克反應(yīng)堆中等離子體的形狀。這些方法可以擴(kuò)展到其他實(shí)驗(yàn)設(shè)施,如粒子加速器、望遠(yuǎn)鏡陣列或引力波探測(cè)器。
使用AI模擬實(shí)驗(yàn)在不同學(xué)科中看起來(lái)會(huì)非常不同,但一個(gè)共同點(diǎn)是模擬通常會(huì)通知和指導(dǎo)物理實(shí)驗(yàn),而不是替代它們。例如,普通人的DNA中有超過(guò)9000個(gè)錯(cuò)義變異,或單字母替換。這些遺傳變異大多數(shù)是良性的,但有些可能會(huì)破壞蛋白質(zhì)執(zhí)行的功能,導(dǎo)致罕見(jiàn)遺傳疾病如囊性纖維化以及常見(jiàn)疾病如癌癥。對(duì)這些變異影響的物理實(shí)驗(yàn)通常限于單一蛋白質(zhì)。我們的AlphaMissense模型將7100萬(wàn)個(gè)潛在的人類錯(cuò)義變異中的89%分類為可能無(wú)害或有害,使科學(xué)家能夠?qū)⑺麄兊奈锢韺?shí)驗(yàn)集中在最可能導(dǎo)致疾病的變異上。
4. 模型
建模復(fù)雜系統(tǒng)及其組件如何相互作用
在1960年的一篇論文中,諾貝爾獎(jiǎng)獲得者物理學(xué)家尤金·維格納對(duì)數(shù)學(xué)方程在模擬重要自然現(xiàn)象(如行星運(yùn)動(dòng))方面的“不合理的有效性”感到驚訝。然而,在過(guò)去的半個(gè)世紀(jì)中,依賴于一組方程或其他確定性假設(shè)的模型在捕捉生物學(xué)、經(jīng)濟(jì)學(xué)、天氣等領(lǐng)域的系統(tǒng)的全部復(fù)雜性方面一直存在困難。這反映了這些系統(tǒng)的組成部分?jǐn)?shù)量龐大,以及它們的動(dòng)態(tài)性和潛在的突發(fā)性、隨機(jī)性或混沌行為。在模擬這些系統(tǒng)方面的挑戰(zhàn)阻礙了科學(xué)家預(yù)測(cè)或控制它們將如何行為的能力,包括在沖擊或干預(yù)期間,如氣溫上升、新藥物或稅收政策的引入。
AI可以通過(guò)吸收更多關(guān)于它們的數(shù)據(jù),并在這些數(shù)據(jù)中學(xué)習(xí)更強(qiáng)大的模式和規(guī)律,更準(zhǔn)確地模擬這些復(fù)雜系統(tǒng)。例如,現(xiàn)代天氣預(yù)報(bào)是科學(xué)和工程的勝利。對(duì)于政府和工業(yè)來(lái)說(shuō),它通知了從可再生能源規(guī)劃到準(zhǔn)備颶風(fēng)和洪水的一切。對(duì)于公眾來(lái)說(shuō),天氣是谷歌搜索上最受歡迎的非品牌查詢。傳統(tǒng)的數(shù)值預(yù)測(cè)方法基于精心定義的物理方程,提供了非常有用但不完美的大氣復(fù)雜動(dòng)態(tài)的近似。它們?cè)谶\(yùn)行時(shí)也是計(jì)算成本高昂的。在2023年,我們發(fā)布了一個(gè)深度學(xué)習(xí)系統(tǒng),可以預(yù)測(cè)多達(dá)10天的氣候條件,這在準(zhǔn)確性和預(yù)測(cè)速度上超越了傳統(tǒng)模型。正如我們下面將要展開(kāi)的,使用AI預(yù)測(cè)天氣變量也可以幫助減輕和應(yīng)對(duì)氣候變化。例如,當(dāng)飛行員飛越潮濕地區(qū)時(shí),可能會(huì)導(dǎo)致凝結(jié)尾跡,這有助于航空對(duì)全球變暖的影響。谷歌科學(xué)家最近使用AI預(yù)測(cè)何時(shí)何地可能出現(xiàn)潮濕地區(qū),以幫助飛行員避免飛越它們。
在許多情況下,AI將豐富傳統(tǒng)的方法來(lái)模擬復(fù)雜系統(tǒng),而不是取代它們。例如,基于代理的建模模擬了個(gè)體行為者之間的相互作用,如公司和消費(fèi)者,以了解這些相互作用可能如何影響一個(gè)更大的更復(fù)雜的系統(tǒng),如經(jīng)濟(jì)。傳統(tǒng)的方法要求科學(xué)家事先指定這些計(jì)算代理應(yīng)該如何行為。我們的研究團(tuán)隊(duì)最近概述了科學(xué)家如何使用LLM創(chuàng)建更靈活的生成代理,它們可以通信和采取行動(dòng),如搜索信息或進(jìn)行購(gòu)買(mǎi),同時(shí)也推理和記住這些行動(dòng)??茖W(xué)家還可以使用強(qiáng)化學(xué)習(xí)來(lái)研究這些代理如何在更動(dòng)態(tài)的模擬中學(xué)習(xí)和適應(yīng)他們的行為,例如在引入新的能源價(jià)格或大流行應(yīng)對(duì)政策時(shí)。
5. 解決方案
識(shí)別具有大搜索空間問(wèn)題的新解決方案
許多重要的科學(xué)問(wèn)題伴隨著實(shí)際上難以理解的潛在解決方案數(shù)量。例如,生物學(xué)家和化學(xué)家的目標(biāo)是確定分子的結(jié)構(gòu)、特性和功能,如蛋白質(zhì)。這樣的工作的一個(gè)目標(biāo)是幫助設(shè)計(jì)這些分子的新版本,作為抗體藥物、塑料降解酶或新材料。然而,要設(shè)計(jì)一個(gè)小分子藥物,科學(xué)家面臨著超過(guò)10^60個(gè)潛在選項(xiàng)。要設(shè)計(jì)一個(gè)具有400個(gè)標(biāo)準(zhǔn)氨基酸的蛋白質(zhì),他們面臨著2^400個(gè)選項(xiàng)。這些大搜索空間不僅限于分子,而是許多科學(xué)問(wèn)題的常見(jiàn)現(xiàn)象,如尋找數(shù)學(xué)問(wèn)題的最好證明,計(jì)算機(jī)科學(xué)任務(wù)的最有效算法,或計(jì)算機(jī)芯片的最佳架構(gòu)。
傳統(tǒng)上,科學(xué)家依賴于直覺(jué)、試錯(cuò)、迭代或蠻力計(jì)算的某種組合來(lái)找到最好的分子、證明或算法。然而,這些方法難以利用潛在解決方案的巨大空間,留下更好的未被發(fā)現(xiàn)。AI可以開(kāi)辟這些搜索空間的新部分,同時(shí)也更快地鎖定最有可能可行和有用的解決方案——這是一個(gè)微妙的平衡行為。例如,在7月,我們的AlphaProof和AlphaGeometry 2系統(tǒng)正確解決了國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中的六個(gè)問(wèn)題中的四個(gè),這是一個(gè)精英高中競(jìng)賽。這些系統(tǒng)利用我們的Gemini LLM架構(gòu)為給定的數(shù)學(xué)問(wèn)題生成大量新的想法和潛在解決方案,并結(jié)合在數(shù)學(xué)邏輯基礎(chǔ)上的系統(tǒng),可以迭代地朝著最有可能正確的候選解決方案工作。
AI科學(xué)家或AI賦能的科學(xué)家?
AI在科學(xué)中的日益增長(zhǎng)的使用,以及早期AI科學(xué)助手的出現(xiàn),引發(fā)了關(guān)于AI的能力將如何快速發(fā)展以及對(duì)人類科學(xué)家意味著什么的疑問(wèn)。當(dāng)前基于LLM的AI科學(xué)助手對(duì)相對(duì)較窄范圍的任務(wù)做出了相對(duì)較小的貢獻(xiàn),例如支持文獻(xiàn)綜述。在不久的將來(lái),它們有可能在這些任務(wù)上變得更好,并且能夠承擔(dān)更有意義的任務(wù),如幫助生成有力的假設(shè)或幫助預(yù)測(cè)實(shí)驗(yàn)結(jié)果。然而,當(dāng)前的系統(tǒng)仍然難以處理人類科學(xué)家依賴于這些任務(wù)的更深層次的創(chuàng)造力和推理。正在努力提高這些AI能力,例如通過(guò)將LLM與邏輯推理引擎結(jié)合,如我們的AlphaProof和AlphaGeometry 2示例,但需要進(jìn)一步的突破。加速或自動(dòng)化實(shí)驗(yàn)的能力對(duì)于那些需要在濕實(shí)驗(yàn)室中進(jìn)行復(fù)雜操作、與人類參與者互動(dòng)或漫長(zhǎng)過(guò)程(如監(jiān)測(cè)疾病進(jìn)展)的實(shí)驗(yàn)來(lái)說(shuō)將更加困難。盡管如此,這些領(lǐng)域的工作正在進(jìn)行中,例如新型實(shí)驗(yàn)室機(jī)器人和自動(dòng)化實(shí)驗(yàn)室。
即使AI系統(tǒng)的能力得到提高,最大的邊際收益也將來(lái)自于將它們部署在發(fā)揮其相對(duì)優(yōu)勢(shì)的用例中——例如,從大型數(shù)據(jù)集中快速提取信息的能力——以及幫助解決真正的科學(xué)進(jìn)步瓶頸,如上述五個(gè)機(jī)會(huì),而不是自動(dòng)化人類科學(xué)家已經(jīng)做得很好的任務(wù)。隨著AI使科學(xué)變得更便宜、更強(qiáng)大,對(duì)科學(xué)和科學(xué)家的需求也將增長(zhǎng)。
例如,最近的突破已經(jīng)導(dǎo)致在蛋白質(zhì)設(shè)計(jì)、材料科學(xué)和天氣預(yù)報(bào)等領(lǐng)域出現(xiàn)了許多新的初創(chuàng)公司。與其他部門(mén)不同,盡管過(guò)去有相反的說(shuō)法,但對(duì)未來(lái)科學(xué)的需求似乎是實(shí)際上無(wú)限的。新的進(jìn)展總是打開(kāi)了科學(xué)知識(shí)地圖中新的、不可預(yù)測(cè)的區(qū)域,AI也將如此。正如赫伯特·西蒙所設(shè)想的,AI系統(tǒng)也將成為科學(xué)研究的對(duì)象,科學(xué)家將發(fā)揮領(lǐng)導(dǎo)作用,評(píng)估和解釋他們的科學(xué)能力,以及開(kāi)發(fā)新型的人類-AI科學(xué)系統(tǒng)。
Part B: 要素
我們對(duì)AI for Science努力成功的要素感興趣——這些要素既涉及單個(gè)研究工作層面,也涉及科學(xué)生態(tài)系統(tǒng)層面,政策制定者在后者中有更大的影響力來(lái)塑造它們。我們采訪的專家們經(jīng)常引用幾個(gè)要素,我們將它們組織成一個(gè)玩具模型,我們稱之為AI for Science生產(chǎn)函數(shù)。這個(gè)生產(chǎn)函數(shù)并不意味著是全面的、規(guī)定的或一個(gè)整潔的線性過(guò)程。這些要素對(duì)許多人來(lái)說(shuō)是直觀的,但我們的采訪揭示了它們?cè)趯?shí)踐中的樣子的一些教訓(xùn),我們?cè)谙旅娣窒怼?/span>
1. 問(wèn)題選擇
追求雄心勃勃的、AI塑造的問(wèn)題
科學(xué)進(jìn)步取決于能夠識(shí)別一個(gè)重要的問(wèn)題以及提出關(guān)于如何解決它的正確問(wèn)題。在他們對(duì)科學(xué)突破起源的探索中,Venkatesh Narayanamurti和Jeffrey Y. Tsao記錄了問(wèn)題和答案之間相互和遞歸關(guān)系的重要性,包括提出雄心勃勃的新問(wèn)題的重要性。
我們的科學(xué)團(tuán)隊(duì)首先考慮一個(gè)潛在的研究問(wèn)題是否足夠重要,以證明投入大量時(shí)間和資源的合理性。我們的首席執(zhí)行官Demis Hassabis有一個(gè)心理模型來(lái)指導(dǎo)這個(gè)評(píng)估:將所有科學(xué)視為知識(shí)樹(shù)。我們特別感興趣的是根——基本的“根節(jié)點(diǎn)問(wèn)題”,如蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)或量子化學(xué),如果解決了,可以解鎖全新的研究和應(yīng)用分支。
為了評(píng)估AI是否合適和附加,我們尋找具有某些特征的問(wèn)題,如巨大的組合搜索空間、大量的數(shù)據(jù)和明確的客觀函數(shù)來(lái)衡量性能。通常,一個(gè)問(wèn)題原則上適合AI,但輸入尚未到位,需要稍后存儲(chǔ)。AlphaFold的一個(gè)最初靈感是Demis多年前作為學(xué)生時(shí)與一個(gè)對(duì)蛋白質(zhì)折疊問(wèn)題著迷的朋友的對(duì)話。最近的許多突破也以重要的科學(xué)問(wèn)題和剛剛成熟的AI方法的結(jié)合為特色。例如,我們的聚變工作得益于一種名為最大后驗(yàn)策略優(yōu)化的新強(qiáng)化學(xué)習(xí)算法,該算法剛剛發(fā)布。與我們的合作伙伴EPFL剛剛開(kāi)發(fā)的新的快速準(zhǔn)確模擬器一起,使團(tuán)隊(duì)能夠克服數(shù)據(jù)匱乏的挑戰(zhàn)。除了選擇正確的問(wèn)題,還重要的是以正確的難度級(jí)別明確它。我們的采訪對(duì)
象強(qiáng)調(diào),一個(gè)強(qiáng)大的AI問(wèn)題陳述通常是適合中間結(jié)果的問(wèn)題。如果你選擇的問(wèn)題太難,你將無(wú)法產(chǎn)生足夠的信號(hào)來(lái)取得進(jìn)展。正確做到這一點(diǎn)依賴于直覺(jué)和實(shí)驗(yàn)。
2. 評(píng)估
投資于能夠提供穩(wěn)健性能信號(hào)并得到社區(qū)認(rèn)可的評(píng)估方法
科學(xué)家使用評(píng)估方法,如基準(zhǔn)測(cè)試、指標(biāo)和競(jìng)賽,來(lái)評(píng)估AI模型的科學(xué)能力。做得好,這些評(píng)估提供了跟蹤進(jìn)展的方式,鼓勵(lì)方法上的創(chuàng)新,并激發(fā)研究人員對(duì)科學(xué)問(wèn)題的興趣。通常,需要各種評(píng)估方法。例如,我們的天氣預(yù)報(bào)團(tuán)隊(duì)首先使用基于幾個(gè)關(guān)鍵變量的初始“進(jìn)度指標(biāo)”,如表面溫度,他們用來(lái)“爬山”或逐漸改進(jìn)他們的模型性能。當(dāng)模型達(dá)到一定的性能水平時(shí),他們進(jìn)行了更全面的評(píng)估,使用了超過(guò)1300個(gè)指標(biāo),這些指標(biāo)受到了歐洲中期天氣預(yù)報(bào)中心的評(píng)估記分卡的啟發(fā)。在以前的工作中,團(tuán)隊(duì)了解到AI模型有時(shí)可以以不希望的方式在這些指標(biāo)上取得好成績(jī)。例如,“模糊”預(yù)測(cè)——例如預(yù)測(cè)在一個(gè)大的地理區(qū)域內(nèi)的降雨——比“尖銳”預(yù)測(cè)——例如預(yù)測(cè)風(fēng)暴在一個(gè)與實(shí)際位置略有不同的地點(diǎn)——受到的懲罰要小,即所謂的“雙重懲罰”問(wèn)題。為了提供進(jìn)一步的驗(yàn)證,團(tuán)隊(duì)評(píng)估了他們的模型在下游任務(wù)中的有用性,如其預(yù)測(cè)氣旋軌跡的能力,以及表征可能導(dǎo)致洪水的“大氣河流”——集中的水分帶——的強(qiáng)度。
最有影響力的AI for Science評(píng)估方法通常是社區(qū)驅(qū)動(dòng)或認(rèn)可的。黃金標(biāo)準(zhǔn)是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的關(guān)鍵評(píng)估競(jìng)賽。自1994年由John Moult教授和Krzysztof Fidelis教授建立以來(lái),每?jī)赡昱e行一次的CASP競(jìng)賽挑戰(zhàn)研究小組將他們的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型的準(zhǔn)確性與真正的、未發(fā)布的實(shí)驗(yàn)蛋白質(zhì)結(jié)構(gòu)進(jìn)行對(duì)比。它還成為了一個(gè)獨(dú)特的全球社區(qū)和研究進(jìn)展的催化劑,盡管很難迅速?gòu)?fù)制。對(duì)社區(qū)認(rèn)可的需求也提供了一個(gè)理由,即為什么基準(zhǔn)測(cè)試應(yīng)該被發(fā)布,以便研究人員可以使用、批評(píng)和改進(jìn)它們。然而,這也帶來(lái)了基準(zhǔn)測(cè)試將“泄露”到AI模型的訓(xùn)練數(shù)據(jù)中,減少其跟蹤進(jìn)展的有用性的風(fēng)險(xiǎn)。沒(méi)有完美的解決方案來(lái)解決這種權(quán)衡,但至少需要定期發(fā)布新的公共基準(zhǔn)測(cè)試。科學(xué)家、AI實(shí)驗(yàn)室和政策制定者還應(yīng)該探索新的方法來(lái)評(píng)估AI模型的科學(xué)能力,例如建立新的第三方評(píng)估組織、競(jìng)賽,并使科學(xué)家能夠更開(kāi)放地探索AI模型的能力。
3. 計(jì)算
跟蹤計(jì)算使用的發(fā)展,并投資于專業(yè)技能
多次政府審查認(rèn)識(shí)到計(jì)算對(duì)AI、科學(xué)和更廣泛經(jīng)濟(jì)進(jìn)展的日益增長(zhǎng)的重要性。正如我們下面將進(jìn)一步討論的,對(duì)計(jì)算的能源消耗和溫室氣體排放的關(guān)注也在增長(zhǎng)。AI實(shí)驗(yàn)室和政策制定者應(yīng)該采取一個(gè)腳踏實(shí)地的長(zhǎng)期觀點(diǎn),考慮計(jì)算需求如何在不同的AI模型和用例中變化,潛在的乘數(shù)效應(yīng)和效率增益,以及這與不使用AI的科學(xué)進(jìn)展的替代方法相比如何。
例如,一些最先進(jìn)的AI模型,如蛋白質(zhì)設(shè)計(jì),相對(duì)較小。像LLM這樣的大型模型訓(xùn)練起來(lái)計(jì)算密集,但通常需要較少的計(jì)算來(lái)微調(diào),或者運(yùn)行推理,這可以為科學(xué)研究開(kāi)辟更有效的途徑。一旦訓(xùn)練了LLM,也更容易使其更有效,例如通過(guò)更好的數(shù)據(jù)管理,或者通過(guò)將大型模型“蒸餾”成小型模型。計(jì)算需求也應(yīng)該與其他科學(xué)進(jìn)展模型進(jìn)行評(píng)估。例如,AI天氣預(yù)報(bào)模型訓(xùn)練起來(lái)計(jì)算密集,但仍然可能比傳統(tǒng)技術(shù)更計(jì)算效率高。這些細(xì)微差別強(qiáng)調(diào)了AI實(shí)驗(yàn)室和政策制定者需要實(shí)證跟蹤計(jì)算使用,了解其發(fā)展趨勢(shì),并預(yù)測(cè)這些趨勢(shì)對(duì)未來(lái)需求意味著什么。除了確保獲得正確類型的芯片外,計(jì)算策略還應(yīng)該優(yōu)先考慮管理訪問(wèn)和確??煽啃运璧年P(guān)鍵基礎(chǔ)設(shè)施和工程技能。這在學(xué)術(shù)界和公共研究機(jī)構(gòu)中通常資源不足。
4. 數(shù)據(jù)
混合自上而下和自下而上的努力來(lái)收集、管理、存儲(chǔ)和訪問(wèn)數(shù)據(jù)
與計(jì)算類似,數(shù)據(jù)可以被視為AI for Science努力的關(guān)鍵基礎(chǔ)設(shè)施,需要隨著時(shí)間的推移進(jìn)行開(kāi)發(fā)、維護(hù)和更新。討論通常集中在確定政策制定者和從業(yè)者應(yīng)該創(chuàng)建的新數(shù)據(jù)集上。自上而下的努力有其作用。在2012年,奧巴馬政府啟動(dòng)了材料項(xiàng)目,以繪制已知和預(yù)測(cè)的材料,如在電池、太陽(yáng)能板和計(jì)算機(jī)芯片中發(fā)現(xiàn)的無(wú)機(jī)晶體硅。我們最近的GNoME努力使用這些數(shù)據(jù)預(yù)測(cè)了220萬(wàn)個(gè)新的無(wú)機(jī)晶體,包括380,000個(gè)模擬表明在低溫下穩(wěn)定的晶體,使它們成為新材料的候選者。
然而,通常很難事先預(yù)測(cè)哪些科學(xué)數(shù)據(jù)集將最重要,許多AI for Science突破依賴于更有機(jī)地出現(xiàn)的數(shù)據(jù),這要感謝有進(jìn)取心的個(gè)人或小團(tuán)隊(duì)的努力。例如,丹尼爾·麥克阿瑟,當(dāng)時(shí)是Broad Institute的研究員,領(lǐng)導(dǎo)了gnomAD遺傳變異數(shù)據(jù)集的開(kāi)發(fā),我們的AlphaMissense工作隨后借鑒了這些數(shù)據(jù)。類似地,數(shù)學(xué)證明助手和編程語(yǔ)言Lean最初是由程序員萊昂納多·德·莫拉開(kāi)發(fā)的。它不是一個(gè)數(shù)據(jù)集,但現(xiàn)在許多AI實(shí)驗(yàn)室使用它來(lái)幫助訓(xùn)練他們的AI數(shù)學(xué)模型,包括我們的AlphaProof系統(tǒng)。像gnomAD或Lean這樣的努力突出了自上而下的數(shù)據(jù)工作需要與更好的激勵(lì)措施相結(jié)合,以激勵(lì)數(shù)據(jù)管道各個(gè)階段的個(gè)人。例如,一些來(lái)自戰(zhàn)
略性濕實(shí)驗(yàn)室實(shí)驗(yàn)的數(shù)據(jù)目前被丟棄,但如果有穩(wěn)定的資金,可以收集和存儲(chǔ)。數(shù)據(jù)管理也可以更好地激勵(lì)。我們的AlphaFold模型是在蛋白質(zhì)數(shù)據(jù)銀行的數(shù)據(jù)上訓(xùn)練的,這些數(shù)據(jù)的質(zhì)量特別高,因?yàn)槠诳髮⒌鞍踪|(zhì)結(jié)構(gòu)作為發(fā)表的先決條件,PDB的專業(yè)數(shù)據(jù)管理者為此數(shù)據(jù)開(kāi)發(fā)了標(biāo)準(zhǔn)。在基因組學(xué)中,許多研究人員也有義務(wù)在序列讀取存檔中存放原始測(cè)序數(shù)據(jù),但不一致的標(biāo)準(zhǔn)意味著各個(gè)數(shù)據(jù)集通常仍然需要重新處理和組合。一些其他高質(zhì)量的數(shù)據(jù)集根本沒(méi)有使用,因?yàn)樵S可條件限制,如在生物多樣性中,或者因?yàn)閿?shù)據(jù)集沒(méi)有發(fā)布,如幾十年來(lái)由公共資金資助的聚變實(shí)驗(yàn)的數(shù)據(jù)。這些情況可能有邏輯原因,如缺乏時(shí)間、資金、放置數(shù)據(jù)的地方,或研究人員需要臨時(shí)禁運(yùn)期來(lái)開(kāi)發(fā)數(shù)據(jù)。但在總體上,這些數(shù)據(jù)訪問(wèn)問(wèn)題構(gòu)成了使用AI推進(jìn)科學(xué)進(jìn)展的關(guān)鍵瓶頸。
5. 組織設(shè)計(jì)
在自下而上的創(chuàng)造力和自上而下的協(xié)調(diào)之間找到正確的平衡
一個(gè)簡(jiǎn)單的啟發(fā)式方法是,學(xué)術(shù)界和工業(yè)界在科學(xué)研究方向上處于兩個(gè)極端。學(xué)術(shù)界往往更自下而上,工業(yè)實(shí)驗(yàn)室往往更自上而下。實(shí)際上,在最成功的實(shí)驗(yàn)室之間,尤其是貝爾實(shí)驗(yàn)室和施樂(lè)帕克研究中心這樣的黃金時(shí)代,它們以藍(lán)天研究而聞名,并在DeepMind的創(chuàng)立中激發(fā)了靈感,一直有很多空間。最近,一波新的科學(xué)研究機(jī)構(gòu)出現(xiàn)了,它們?cè)噲D從這些異常例子中學(xué)習(xí)。這些組織在目標(biāo)、資金模式、學(xué)科重點(diǎn)和工作組織上有所不同。但總的來(lái)說(shuō),它們希望提供更多的高風(fēng)險(xiǎn)、高回報(bào)的研究,更少的官僚主義,以及更好的科學(xué)家激勵(lì)。
許多組織有一個(gè)強(qiáng)烈的焦點(diǎn),即應(yīng)用AI,如英國(guó)高級(jí)研究與發(fā)明機(jī)構(gòu)、Arc研究所,以及越來(lái)越多的專注于解決科學(xué)中特定問(wèn)題的專注研究組織,這些問(wèn)題對(duì)于學(xué)術(shù)界來(lái)說(shuō)太大,對(duì)于工業(yè)來(lái)說(shuō)不夠有利可圖,如負(fù)責(zé)擴(kuò)展對(duì)AI數(shù)學(xué)研究至關(guān)重要的Lean證明助手的組織。
在它們的核心,這些新機(jī)構(gòu)希望找到自上而下的協(xié)調(diào)和自下而上的科學(xué)家賦權(quán)之間的更好融合。對(duì)于一些組織來(lái)說(shuō),這意味著專注于一個(gè)特定的問(wèn)題,并預(yù)先指定里程碑。對(duì)于其他人來(lái)說(shuō),這意味著向主要研究者提供更多的不受限制的資金。正確地平衡這一點(diǎn)對(duì)于吸引和留住研究領(lǐng)導(dǎo)者至關(guān)重要,他們也必須接受它才能成功——Demis Hassabis將其視為成功協(xié)調(diào)大規(guī)模尖端研究的最重要因素。在單個(gè)研究工作內(nèi)正確平衡這一點(diǎn)也很重要。在Google DeepMind的情況下,努力通常在更多的非結(jié)構(gòu)化“探索”階段和更快的“開(kāi)發(fā)”階段之間轉(zhuǎn)換,團(tuán)隊(duì)在“探索”階段尋找新的想法,在“開(kāi)發(fā)”階段專注于工程和擴(kuò)展性能。知道何時(shí)在這些模式之間切換以及如何相應(yīng)地調(diào)整項(xiàng)目團(tuán)隊(duì),是一門(mén)藝術(shù)。
6. 跨學(xué)科
將科學(xué)視為團(tuán)隊(duì)合作,資助被忽視的角色,并促進(jìn)可爭(zhēng)議性的文化
許多最困難的科學(xué)問(wèn)題需要在領(lǐng)域之間的進(jìn)步。然而,當(dāng)從業(yè)者聚集在一起時(shí),例如在Covid-19期間,他們通常難以從多學(xué)科團(tuán)隊(duì)——他們各自保留自己的學(xué)科角度——轉(zhuǎn)變?yōu)檎嬲目鐚W(xué)科,他們集體開(kāi)發(fā)共享的想法和方法。這一挑戰(zhàn)反映了科學(xué)知識(shí)的日益專業(yè)化,以及通常主要根據(jù)他們的核心專業(yè)知識(shí)評(píng)估從業(yè)者的激勵(lì)措施,如資金。
AI for Science努力通常默認(rèn)是多學(xué)科的,但要成功,他們需要成為真正的跨學(xué)科。一個(gè)起點(diǎn)是選擇一個(gè)需要每種專業(yè)知識(shí)的問(wèn)題,然后提供足夠的時(shí)間和重點(diǎn)來(lái)培養(yǎng)圍繞它的團(tuán)隊(duì)動(dòng)態(tài)。例如,我們的伊薩卡項(xiàng)目使用AI恢復(fù)和歸因損壞的古希臘銘文,這可能幫助從業(yè)者研究過(guò)去文明的思想、語(yǔ)言和歷史。要成功,項(xiàng)目共同領(lǐng)導(dǎo)Yannis Assael不得不發(fā)展對(duì)碑文學(xué)的了解——古代銘文文本的研究。項(xiàng)目的碑文學(xué)家,反過(guò)來(lái),不得不了解AI模型的工作方式,鑒于直覺(jué)對(duì)他們的工作的重要性。培養(yǎng)這些團(tuán)隊(duì)動(dòng)態(tài)需要正確的激勵(lì)措施。授權(quán)一個(gè)小型、緊密的團(tuán)隊(duì)專注于解決問(wèn)題,而不是論文的作者身份,是AlphaFold 2突破的關(guān)鍵。這種類型的專注可以更容易地在工業(yè)實(shí)驗(yàn)室中實(shí)現(xiàn),但再次強(qiáng)調(diào)了長(zhǎng)期公共研究資金的重要性,這些資金與出版壓力較少相關(guān)。
為了實(shí)現(xiàn)真正的跨學(xué)科,組織還需要為個(gè)人創(chuàng)建角色和職業(yè)道路,他們可以幫助融合學(xué)科。在Google DeepMind,我們的研究工程師鼓勵(lì)研究和工程之間的正反饋循環(huán),而我們的項(xiàng)目經(jīng)理幫助培養(yǎng)研究工作內(nèi)的團(tuán)隊(duì)動(dòng)態(tài),并在它們之間創(chuàng)建聯(lián)系。我們還優(yōu)先雇傭喜歡發(fā)現(xiàn)和連接領(lǐng)域之間聯(lián)系的個(gè)人,以及那些有動(dòng)力在新領(lǐng)域迅速提高技能的人。為了鼓勵(lì)思想的交叉?zhèn)鞑?,我們還鼓勵(lì)科學(xué)家和工程師定期更換項(xiàng)目。最終的目標(biāo)是創(chuàng)建一個(gè)鼓勵(lì)好奇心、謙遜以及經(jīng)濟(jì)歷史學(xué)家Joel Mokyr所稱的“可爭(zhēng)議性”的文化——不同背景的從業(yè)者都感到有權(quán)力以公開(kāi)講座和討論線索的形式提出和建設(shè)性地批評(píng)彼此的工作。
7. 采用
仔細(xì)考慮最佳訪問(wèn)選項(xiàng),并聚焦AI模型的不確定性
許多AI for Science模型,如AlphaFold或我們的天氣預(yù)報(bào)工作,就它們執(zhí)行的任務(wù)數(shù)量而言是專業(yè)的。但從它們被許多科學(xué)家使用的角度來(lái)看,它們也是通用的,用于從理解疾病到改進(jìn)捕魚(yú)計(jì)劃等一切事物。這種影響遠(yuǎn)非保證。疾病的細(xì)菌理論花了很長(zhǎng)時(shí)間才傳播開(kāi)來(lái),而科學(xué)突破可能帶來(lái)的下游產(chǎn)品,如新抗生素,通常缺乏正確的市場(chǎng)激勵(lì)。
在決定如何發(fā)布我們的模型時(shí),我們?cè)噲D平衡對(duì)科學(xué)家廣泛采用和驗(yàn)證的渴望與商業(yè)目標(biāo)和其他考慮,如潛在的安全風(fēng)險(xiǎn)。我們還創(chuàng)建了一個(gè)專門(mén)的Impact Accelerator,以推動(dòng)突破的采用,并鼓勵(lì)可能不會(huì)發(fā)生的社會(huì)有益應(yīng)用,包括通過(guò)與Drugs for Neglected Diseases Initiative和Global Antibiotic Research & Development Partnership等組織的合作伙伴關(guān)系,這些組織有類似的任務(wù)。
為了鼓勵(lì)可能從新模型或數(shù)據(jù)集中受益的科學(xué)家使用它,開(kāi)發(fā)人員需要使科學(xué)家盡可能容易地使用和集成到他們的工作流程中??紤]到這一點(diǎn),對(duì)于AlphaFold 2,我們開(kāi)源了代碼,還與EMBL-EBI合作開(kāi)發(fā)了一個(gè)數(shù)據(jù)庫(kù),科學(xué)家,包括那些計(jì)算技能和基礎(chǔ)設(shè)施較少的科學(xué)家,可以搜索和下載現(xiàn)成的2億個(gè)蛋白質(zhì)結(jié)構(gòu)。AlphaFold 3擴(kuò)展了模型的能力,導(dǎo)致了潛在預(yù)測(cè)數(shù)量的組合爆炸。這創(chuàng)造了一個(gè)新的界面AlphaFold Server的需求,它允許科學(xué)家按需創(chuàng)建結(jié)構(gòu)??茖W(xué)界還開(kāi)發(fā)了自己的AlphaFold工具,如ColabFold,展示了存在的多樣化需求,以及培養(yǎng)科學(xué)界計(jì)算技能的價(jià)值,以解決這些需求。
科學(xué)家還需要信任一個(gè)AI模型,以便使用它。我們?cè)谙旅鎸⒏敿?xì)地討論可靠性問(wèn)題,但一個(gè)有用的起點(diǎn)是主動(dòng)表明科學(xué)家應(yīng)該如何使用一個(gè)模型,以及它的不確定性。以AlphaFold為例,在與科學(xué)家的對(duì)話之后,團(tuán)隊(duì)開(kāi)發(fā)了不確定性指標(biāo),這些指標(biāo)傳達(dá)了模型對(duì)于給定蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的“信心”程度,并通過(guò)直觀的可視化支持。我們還與EMBL-EBI合作開(kāi)發(fā)了一個(gè)培訓(xùn)模塊,提供如何最佳使用AlphaFold的指導(dǎo),包括如何解釋這些信心指標(biāo),以及其他科學(xué)家如何使用它的實(shí)際例子。同樣,我們的Med-Gemini系統(tǒng)最近在回答健康相關(guān)問(wèn)題上實(shí)現(xiàn)了最先進(jìn)的性能。它采用了一種由不確定性引導(dǎo)的方法,通過(guò)生成多個(gè)“推理鏈”來(lái)回答一個(gè)問(wèn)題。然后,它使用這些初始答案之間的相對(duì)差異來(lái)計(jì)算答案的不確定性。當(dāng)不確定性很高時(shí),它會(huì)調(diào)用網(wǎng)絡(luò)搜索來(lái)整合最新、最準(zhǔn)確的信息。
8. 合作伙伴關(guān)系
旨在早期對(duì)齊和明確的值交換
AI for Science努力需要多樣性的專業(yè)知識(shí),這創(chuàng)造了強(qiáng)烈的合作伙伴需求——無(wú)論是正式的還是非正式的——在公共和私人組織之間。這些合作伙伴關(guān)系在項(xiàng)目生命周期中都是需要的,從創(chuàng)建數(shù)據(jù)集到分享研究。特別是,AI實(shí)驗(yàn)室通常需要科學(xué)家?guī)椭u(píng)估AI模型的輸出。例如,最近的研究強(qiáng)調(diào)了擁有豐富領(lǐng)域?qū)I(yè)知識(shí)的高級(jí)材料科學(xué)家在評(píng)估AI模型預(yù)測(cè)的新材料是否可行方面的重要性。同樣,我們的蛋白質(zhì)設(shè)計(jì)團(tuán)隊(duì)與弗朗西斯·克里克研究所的研究小組合作,進(jìn)行濕實(shí)驗(yàn)室實(shí)驗(yàn),測(cè)試我們的AI設(shè)計(jì)的蛋白質(zhì)是否結(jié)合到目標(biāo)上,以及這是否具有期望的功能,如阻止SARS-CoV-2感染細(xì)胞。我們的FunSearch方法能夠?yàn)镃ap Set問(wèn)題開(kāi)發(fā)新的構(gòu)造,這曾經(jīng)是著名數(shù)學(xué)家Terence Tao最喜歡的開(kāi)放問(wèn)題。這得益于與威斯康星大學(xué)麥迪遜分校的數(shù)學(xué)教授和Cap Set專家Jordan Ellenberg的合作。鑒于行業(yè)實(shí)驗(yàn)室在推進(jìn)AI能力方面的中心作用,以及對(duì)豐富領(lǐng)域?qū)I(yè)知識(shí)的需求,這些公私合作伙伴關(guān)系可能對(duì)推進(jìn)AI for Science前沿越來(lái)越重要,可能需要更大的投資,如為大學(xué)和公共研究機(jī)構(gòu)中的合作伙伴團(tuán)隊(duì)提供更多資金。
發(fā)展合作伙伴關(guān)系是困難的。在開(kāi)始討論時(shí),重要的是要早期對(duì)齊總體目標(biāo),并解決可能棘手的問(wèn)題,如各方應(yīng)對(duì)輸出擁有什么權(quán)利,是否應(yīng)該有出版物,模型或數(shù)據(jù)集是否應(yīng)該開(kāi)源,以及應(yīng)該適用什么類型的許可。意見(jiàn)分歧是自然的,通常反映了公共和私人組織的激勵(lì)措施,這些激勵(lì)措施因研究的成熟度或其商業(yè)潛力等因素而大不相同。最成功的合作伙伴關(guān)系涉及明確的值交換,利用每個(gè)組織的優(yōu)勢(shì)。例如,來(lái)自190多個(gè)國(guó)家的200多萬(wàn)用戶已經(jīng)使用了AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)。這需要密切合作,將我們的AI模型與EMBL-EBI的生物策展專業(yè)知識(shí)和科學(xué)網(wǎng)絡(luò)配對(duì)。
9. 安全與責(zé)任
使用評(píng)估來(lái)探索權(quán)衡,并激發(fā)新類型的評(píng)估方法
科學(xué)家經(jīng)常對(duì)AI模型可能對(duì)科學(xué)以及更廣泛社會(huì)帶來(lái)的潛在好處和風(fēng)險(xiǎn)持不同意見(jiàn),有時(shí)意見(jiàn)非常強(qiáng)烈。進(jìn)行倫理和安全評(píng)估可以幫助框架討論,并使科學(xué)家能夠決定是否以及如何開(kāi)發(fā)給定的AI模型。起點(diǎn)是確定最重要的影響領(lǐng)域,并在正確的抽象層次上指定這些領(lǐng)域。有越來(lái)越復(fù)雜的框架來(lái)識(shí)別和分類不同的AI風(fēng)險(xiǎn),如促進(jìn)錯(cuò)誤和虛假信息。但這些框架很少在同一領(lǐng)域考慮AI的潛在好處,如改善對(duì)高質(zhì)量信息綜合的訪問(wèn),或者可能發(fā)生的權(quán)衡,例如,如果你限制對(duì)AI模型的訪問(wèn)或限制其能力。評(píng)估還應(yīng)該澄清它們的時(shí)間范圍,任何影響的相對(duì)確定性,以及AI的相對(duì)重要性或額外性,以實(shí)現(xiàn)它。例如,擔(dān)心AI和氣候變化的人通常關(guān)注立即需要的電力來(lái)訓(xùn)練大型AI模型,而AI支持者通常關(guān)注不那么直接、不那么清晰但可能大得多的下游好處,即未來(lái)的AI應(yīng)用對(duì)氣候的好處。在進(jìn)行評(píng)估時(shí),AI從業(yè)者還應(yīng)該避免過(guò)分關(guān)注模型的能力,這些能力他們會(huì)更接近,更好地理解第三方實(shí)際上會(huì)使用它或受到它影響的程度,這通常需要外部專家的投入才能做得好。
從業(yè)者還需要新的方法來(lái)更好地評(píng)估在科學(xué)中使用AI的潛在風(fēng)險(xiǎn)和好處。目前,許多AI安全評(píng)估依賴于指定模型不應(yīng)輸出的內(nèi)容類型,并量化模型遵循此政策的程度。這些評(píng)估對(duì)于某些使用AI在科學(xué)中造成的風(fēng)險(xiǎn)是有用的,例如生成不準(zhǔn)確的內(nèi)容。但對(duì)于其他風(fēng)險(xiǎn),如生物安全,我們可以可靠地事先指定某些類型的科學(xué)知識(shí)為危險(xiǎn)的想法已經(jīng)受到挑戰(zhàn),因?yàn)榭茖W(xué)知識(shí)的雙重用途性質(zhì),但也因?yàn)檫@些努力往往關(guān)注歷史上造成的傷害,如過(guò)去疫情的病毒,而不是新的風(fēng)險(xiǎn)。更好的方法可能是評(píng)估AI模型的危險(xiǎn)能力,或AI模型在多大程度上提升了人類的危險(xiǎn)性能力。在許多情況下,這些能力也將是雙重用途的,如幫助設(shè)計(jì)或執(zhí)行實(shí)驗(yàn)協(xié)議的能力。這些AI能力在多大程度上指向風(fēng)險(xiǎn)或機(jī)會(huì),將取決于對(duì)潛在威脅行為者的評(píng)估以及對(duì)模型的訪問(wèn)治理。除了安全外,評(píng)估使用AI在科學(xué)中的其他風(fēng)險(xiǎn),如對(duì)科學(xué)創(chuàng)造力或可靠性的風(fēng)險(xiǎn)(我們?cè)谙旅嬗懻摚?,將需要全新的評(píng)估方法。鑒于研究和執(zhí)行這些評(píng)估的難度,最好在社區(qū)層面上追求它們,而不是每個(gè)實(shí)驗(yàn)室追求孤立的努力。
Part C: 風(fēng)險(xiǎn)
政策文件、政府文件和科學(xué)家調(diào)查經(jīng)常提到人工智能在科學(xué)中日益增長(zhǎng)的使用所帶來(lái)的某些風(fēng)險(xiǎn)。其中三個(gè)風(fēng)險(xiǎn)——對(duì)科學(xué)創(chuàng)造力、可靠性和理解的風(fēng)險(xiǎn)——主要與科學(xué)實(shí)踐的方式有關(guān)。另外兩個(gè)風(fēng)險(xiǎn)——對(duì)公平和環(huán)境的風(fēng)險(xiǎn)——主要與科學(xué)如何代表和影響更廣泛的社會(huì)有關(guān)。使用人工智能通常被獨(dú)家呈現(xiàn)為對(duì)這些領(lǐng)域的風(fēng)險(xiǎn),而這些領(lǐng)域,如科學(xué)可靠性或環(huán)境,通常被描繪成穩(wěn)定、有些理想化的術(shù)語(yǔ),這可能忽視了它們面臨的更廣泛的挑戰(zhàn)。我們認(rèn)為,在科學(xué)中使用人工智能最終將惠及這五個(gè)領(lǐng)域,因?yàn)橛袡C(jī)會(huì)減輕人工智能所帶來(lái)的風(fēng)險(xiǎn),并使用人工智能幫助解決這些領(lǐng)域的更廣泛挑戰(zhàn),在某些情況下是深刻的。對(duì)于不公平而言,實(shí)現(xiàn)有益的結(jié)果可能更難,因?yàn)椴还奖磺度氲饺斯ぶ悄芎涂茖W(xué)的多個(gè)層面,從勞動(dòng)力的構(gòu)成到支撐研究的數(shù)據(jù),而對(duì)于科學(xué)創(chuàng)造力而言,這是高度主觀的,所以個(gè)人可能會(huì)合理地對(duì)某個(gè)結(jié)果是否積極有不同的看法。這些細(xì)微差別增加了科學(xué)家、政策制定者和其他人闡明他們對(duì)如何使用人工智能在科學(xué)中將影響這5個(gè)領(lǐng)域期望的價(jià)值。
1. 創(chuàng)造力
人工智能會(huì)導(dǎo)致較少的新穎、違反直覺(jué)的突破嗎?
科學(xué)創(chuàng)造力描述了創(chuàng)造新事物的能力。在實(shí)踐中,科學(xué)家將一個(gè)新想法、方法或產(chǎn)出視為創(chuàng)造性的程度通常取決于更主觀的因素,如其感知的簡(jiǎn)單性、違反直覺(jué)性或美感。今天,科學(xué)創(chuàng)造力受到科學(xué)勞動(dòng)力的相對(duì)同質(zhì)性的影響,這縮小了想法的多樣性。對(duì)研究人員“發(fā)表或消亡”的壓力也激勵(lì)了“跟隨人群”的出版物,而不是通常支撐創(chuàng)造性突破的深入工作或跨學(xué)科的概念橋梁。這可能解釋了為什么導(dǎo)致一個(gè)領(lǐng)域轉(zhuǎn)向新方向的顛覆性科學(xué)想法的比例似乎在下降,超出了科學(xué)擴(kuò)展可能預(yù)期的正常范圍。
一些科學(xué)家擔(dān)心,使用人工智能可能會(huì)加劇這些趨勢(shì),破壞人類科學(xué)家更直觀、非正統(tǒng)和偶然的方法,如伽利略假設(shè)地球自轉(zhuǎn)的假設(shè)。這可能以不同的方式發(fā)生。一個(gè)擔(dān)憂是,AI模型被訓(xùn)練為在其訓(xùn)練數(shù)據(jù)中最小化異常值,而科學(xué)家通常會(huì)通過(guò)關(guān)注一個(gè)令人困惑的數(shù)據(jù)點(diǎn)來(lái)放大異常值。其他人擔(dān)心,AI系統(tǒng)被訓(xùn)練來(lái)執(zhí)行特定任務(wù),因此依賴它們將放棄更偶然的突破,例如研究人員意外地找到他們沒(méi)有研究的問(wèn)題的解決方案。在社區(qū)層面上,一些人擔(dān)心,如果科學(xué)家大規(guī)模擁抱AI,它可能導(dǎo)致輸出的逐漸同質(zhì)化,例如如果LLM對(duì)不同科學(xué)家的查詢產(chǎn)生類似的建議?;蛘?,如果科學(xué)家過(guò)度關(guān)注最適合AI的學(xué)科和問(wèn)題。維持對(duì)探索性研究和非AI研究的支持可能有助于減輕其中一些風(fēng)險(xiǎn)。科學(xué)家也可以調(diào)整他們使用AI的方式,以便它增強(qiáng)而不是削弱他們自己的創(chuàng)造力,例如通過(guò)微調(diào)LLM來(lái)提出更個(gè)性化的研究想法,或幫助科學(xué)家更好地引出自己的想法,類似于我們?cè)缙陂_(kāi)發(fā)AI導(dǎo)師的努力,這些導(dǎo)師可以幫助學(xué)生更好地反思問(wèn)題,而不僅僅是輸出問(wèn)題的答案。AI也可以使新的科學(xué)創(chuàng)造力類型成為可能,這些類型可能不會(huì)以其他方式發(fā)生。一種類型的AI創(chuàng)造力是插值,其中AI系統(tǒng)在其訓(xùn)練數(shù)據(jù)中識(shí)別新穎的想法,特別是當(dāng)人類在這方面的能力有限時(shí),如努力使用AI檢測(cè)大型強(qiáng)子對(duì)撞機(jī)實(shí)驗(yàn)的大規(guī)模數(shù)據(jù)集中的異常。第二種類型是外推,AI模型概括出更新穎的解決方案超出了它們的訓(xùn)練數(shù)據(jù),如我們的AlphaGo系統(tǒng)提出的第37個(gè)動(dòng)作,震驚了人類圍棋專家,或我們的AlphaProof和AlphaGeometry 2系統(tǒng)產(chǎn)生的新穎數(shù)學(xué)證明和非明顯構(gòu)造。第三種類型是發(fā)明,AI系統(tǒng)提出了一個(gè)完全新的理論或科學(xué)體系,與其訓(xùn)練數(shù)據(jù)完全無(wú)關(guān),類似于最初發(fā)展廣義相對(duì)論或創(chuàng)造復(fù)數(shù)。AI系統(tǒng)目前沒(méi)有表現(xiàn)出這種創(chuàng)造力,但新的方法可能會(huì)解鎖這一點(diǎn),例如優(yōu)化不同目標(biāo)的多代理系統(tǒng),如新穎性和違反直覺(jué)性,或訓(xùn)練AI模型以生成新的科學(xué)問(wèn)題,以激發(fā)新的解決方案。
2. 可靠性
人工智能會(huì)使科學(xué)變得不那么自我修正嗎?
可靠性描述了科學(xué)家依賴彼此的發(fā)現(xiàn),并相信它們不是由于偶然或錯(cuò)誤。今天,一系列相互關(guān)聯(lián)的挑戰(zhàn)削弱了科學(xué)的可靠性,包括p-hacking和出版偏見(jiàn),這可能導(dǎo)致研究人員報(bào)告陰性結(jié)果不足;科學(xué)家執(zhí)行日??茖W(xué)任務(wù)時(shí)缺乏標(biāo)準(zhǔn)化;錯(cuò)誤,例如科學(xué)家使用統(tǒng)計(jì)方法時(shí)的錯(cuò)誤;科學(xué)欺詐;以及同行評(píng)審過(guò)程的挑戰(zhàn),包括缺乏合格的同行評(píng)審員。
一些科學(xué)家擔(dān)心,人工智能會(huì)加劇這些挑戰(zhàn),因?yàn)橐恍〢I研究也具有不良實(shí)踐,例如從業(yè)者挑選他們用來(lái)評(píng)估模型性能的評(píng)估。AI模型,特別是LLM,也容易“幻覺(jué)”輸出,包括科學(xué)引用,這些輸出是錯(cuò)誤的或誤導(dǎo)性的。其他人擔(dān)心LLM可能導(dǎo)致類似“論文工廠”生產(chǎn)的低質(zhì)量論文泛濫。社區(qū)正在努力解決這些問(wèn)題,包括為研究人員提供良好實(shí)踐清單以遵守,以及不同類型的AI事實(shí)性研究,例如訓(xùn)練AI模型將其輸出與可信來(lái)源的基礎(chǔ),或幫助驗(yàn)證其他AI模型的輸出。
科學(xué)家也可能使用AI來(lái)提高更廣泛研究基礎(chǔ)的可靠性。例如,如果AI可以幫助自動(dòng)化數(shù)據(jù)注釋或?qū)嶒?yàn)設(shè)計(jì)的方面,這可能為這些領(lǐng)域提供急需的標(biāo)準(zhǔn)化。隨著AI模型變得更擅長(zhǎng)將其輸出與引用基礎(chǔ)聯(lián)系起來(lái),它們也可以幫助科學(xué)家和政策制定者更系統(tǒng)地審查證據(jù)基礎(chǔ),例如在氣候變化方面,政府間氣候變化專門(mén)委員會(huì)等團(tuán)體已經(jīng)在努力跟上出版物的無(wú)情上升。從業(yè)者還可以使用AI幫助檢測(cè)錯(cuò)誤或欺詐性圖像,或誤導(dǎo)性的科學(xué)聲明,如科學(xué)雜志最近試用的AI圖像分析工具的試驗(yàn)。更投機(jī)地,鑒于一些科學(xué)家已經(jīng)使用LLM來(lái)幫助批評(píng)他們自己的論文,并幫助驗(yàn)證AI模型的輸出,例如在定理證明中,AI可能潛在地幫助同行評(píng)審的某些方面。然而,對(duì)于保密性、AI系統(tǒng)檢測(cè)真正新穎工作的能力,以及考慮到同行評(píng)審在批準(zhǔn)資助等過(guò)程中的重要作用,科學(xué)家的接受度也有合理的擔(dān)憂。
3. 理解
人工智能會(huì)導(dǎo)致有用的預(yù)測(cè)以犧牲更深層次的科學(xué)理解為代價(jià)嗎?
在最近的一項(xiàng)自然調(diào)查中,科學(xué)家提到依賴于模式匹配以犧牲更深層次理解為代價(jià),是從使用AI在科學(xué)中獲得的最大風(fēng)險(xiǎn)。理解并非總是發(fā)現(xiàn)新的科學(xué)現(xiàn)象或開(kāi)發(fā)有用應(yīng)用的必要條件,例如超導(dǎo)性或藥物。但大多數(shù)科學(xué)家將理解視為他們的主要目標(biāo),作為人類知識(shí)的最深層次。關(guān)于AI破壞科學(xué)理解的擔(dān)憂包括認(rèn)為現(xiàn)代深度學(xué)習(xí)方法是無(wú)理論的,并且不包含或?yàn)樗鼈冾A(yù)測(cè)的現(xiàn)象提供理論。科學(xué)家還擔(dān)心AI模型是不解釋的,在這個(gè)意義上,它們不是基于明確的一組方程和參數(shù)。還有一個(gè)擔(dān)憂是,任何對(duì)AI模型輸出的解釋對(duì)科學(xué)家來(lái)說(shuō)都不會(huì)是可訪問(wèn)的或有用的??偠灾?,AI模型可能提供有關(guān)蛋白質(zhì)結(jié)構(gòu)或天氣的有用預(yù)測(cè),但它們能夠幫助科學(xué)家理解蛋白質(zhì)為什么以某種方式折疊,或者大氣動(dòng)力學(xué)如何導(dǎo)致天氣變化嗎?
關(guān)于用“低級(jí)……計(jì)算”取代“真正的、理論科學(xué)”的擔(dān)憂并不是新的,曾經(jīng)針對(duì)過(guò)蒙特卡洛方法等過(guò)去技術(shù)。將工程和科學(xué)結(jié)合起來(lái)的領(lǐng)域,如合成生物學(xué),也面臨著優(yōu)先考慮有用應(yīng)用而不是更深層次科學(xué)理解的指責(zé)。這些方法和技術(shù)導(dǎo)致了科學(xué)理解的增長(zhǎng),我們相信AI也會(huì)如此,即使其中一些增長(zhǎng)難以提前預(yù)測(cè)。首先,大多數(shù)AI模型并非無(wú)理論,而是以不同的方式構(gòu)建在先前的知識(shí)上,如在它們的數(shù)據(jù)集和評(píng)估中的構(gòu)造。一些AI模型也有可解釋的輸出。例如,我們的FunSearch方法輸出計(jì)算機(jī)代碼,也描述了它如何到達(dá)解決方案。
研究人員還在研究可解釋性技術(shù),這些技術(shù)可以揭示AI系統(tǒng)如何工作,例如努力識(shí)別模型學(xué)習(xí)的概念。這些可解釋性技術(shù)的許多都有重要的局限性,但它們已經(jīng)使科學(xué)家能夠從AI模型中提取新的科學(xué)假設(shè)。例如,轉(zhuǎn)錄因子是蛋白質(zhì),它們綁定到DNA序列上激活或抑制附近基因的表達(dá)。一項(xiàng)AI研究努力能夠預(yù)測(cè)DNA序列中每個(gè)堿基對(duì)不同轉(zhuǎn)錄因子的結(jié)合的相對(duì)貢獻(xiàn),并使用生物學(xué)家熟悉的概念來(lái)解釋這一結(jié)果。一個(gè)更大的機(jī)會(huì)可能是基于AI系統(tǒng)學(xué)習(xí)的方式學(xué)習(xí)全新的概念。例如,我們的研究人員最近展示了我們的AlphaZero系統(tǒng)學(xué)習(xí)了關(guān)于下棋的“超人”知識(shí),包括非傳統(tǒng)的動(dòng)作和策略,并使用另一個(gè)AI系統(tǒng)提取這些概念并教給人類象棋專家。
即使沒(méi)有可解釋性技術(shù),AI也會(huì)通過(guò)開(kāi)辟新的研究方向來(lái)提高科學(xué)理解,這些方向否則將是禁止的。例如,通過(guò)解鎖生成大量合成蛋白質(zhì)結(jié)構(gòu)的能力,AlphaFold使科學(xué)家能夠跨蛋白質(zhì)結(jié)構(gòu)而不是僅僅跨蛋白質(zhì)序列進(jìn)行搜索。一個(gè)團(tuán)隊(duì)利用這種方法發(fā)現(xiàn)了一個(gè)古老的Cas13蛋白質(zhì)家族成員,它為編輯RNA提供了希望,包括幫助診斷和治療疾病。這一發(fā)現(xiàn)還挑戰(zhàn)了之前關(guān)于Cas13如何進(jìn)化的假設(shè)。相反,努力修改AlphaFold模型架構(gòu)以包含更多先驗(yàn)知識(shí),導(dǎo)致性能更差。這突出了準(zhǔn)確性和可解釋性之間可能發(fā)生的權(quán)衡,但也展示了AI系統(tǒng)如何推進(jìn)科學(xué)理解,不是盡管它們的不透明性,而是因?yàn)樗鼈兊牟煌该餍裕驗(yàn)檫@種不透明性可能源于它們?cè)诟呔S空間中操作的能力,這可能對(duì)人類來(lái)說(shuō)是不可解釋的,但對(duì)科學(xué)突破是必要的。
4. 公平
人工智能會(huì)使科學(xué)對(duì)邊緣群體的代表性和有用性減少嗎?
不公平在科學(xué)勞動(dòng)力中明顯可見(jiàn),在他們研究的問(wèn)題中,在他們開(kāi)發(fā)的數(shù)據(jù)和模型中,以及在結(jié)果的好處和傷害中。這些不公平是相關(guān)的,并且可以隨著時(shí)間的推移而復(fù)合。例如,少數(shù)實(shí)驗(yàn)室和個(gè)人在高收入城市占了科學(xué)產(chǎn)出的不成比例的份額。確定與疾病相關(guān)的遺傳變異的研究嚴(yán)重依賴于歐洲血統(tǒng)群體的數(shù)據(jù),而忽視了熱帶疾病,這些疾病在貧窮國(guó)家中的比例過(guò)高。在農(nóng)業(yè)方面,作物創(chuàng)新集中在高收入國(guó)家最常見(jiàn)的害蟲(chóng)上,然后不恰當(dāng)?shù)赜糜诓煌οx(chóng)的低收入國(guó)家,損害了產(chǎn)量。盡管有積極的趨勢(shì),女性僅占科學(xué)家的33%,在臨床試驗(yàn)中長(zhǎng)期代表性不足,特別是有色女性。
觀察家擔(dān)心,AI在科學(xué)中的日益增長(zhǎng)的使用可能加劇這些不公平。AI和計(jì)算機(jī)科學(xué)勞動(dòng)力在性別、種族和領(lǐng)先實(shí)驗(yàn)室的位置方面比許多其他科學(xué)學(xué)科更不具代表性,因此AI的日益增長(zhǎng)的使用可能會(huì)損害科學(xué)中的更廣泛代表性。作為一種數(shù)據(jù)驅(qū)動(dòng)的技術(shù),AI也冒著繼承和加劇科學(xué)數(shù)據(jù)集中的偏見(jiàn)的風(fēng)險(xiǎn)。
然而,也有機(jī)會(huì)使用AI減少科學(xué)中的不公平,盡管這不是系統(tǒng)性變化的替代品。如果AI模型通過(guò)低成本服務(wù)器或數(shù)據(jù)庫(kù)提供,它們可以更容易、更便宜地讓科學(xué)家,包括來(lái)自邊緣群體的科學(xué)家,研究傳統(tǒng)上被忽視的問(wèn)題,類似于釋放更多衛(wèi)星數(shù)據(jù)導(dǎo)致來(lái)自邊緣社區(qū)的更多研究。通過(guò)吸收更多的數(shù)據(jù),AI模型也可能能夠?qū)W習(xí)科學(xué)家研究的復(fù)雜系統(tǒng)的更普遍模式,使這些模型更健壯,更不容易受到偏見(jiàn)的影響。例如,由于它們的非代表性數(shù)據(jù),確定與疾病相關(guān)的遺傳變異的研究可能會(huì)挑選出混雜的,而不是因果的變異。相反,一些早期嘗試在更大的蛋白質(zhì)結(jié)構(gòu)和遺傳變異數(shù)據(jù)集上訓(xùn)練AI模型,包括跨物種的數(shù)據(jù),表現(xiàn)更好,在預(yù)測(cè)個(gè)體疾病風(fēng)險(xiǎn)方面差異較小,跨人群群體。最終,改善公平將需要長(zhǎng)期的努力,如基因組學(xué)中的H3Africa倡議和AI的深度學(xué)習(xí)Indaba倡議,旨在在最缺乏的地方建立科學(xué)基礎(chǔ)設(shè)施、社區(qū)和教育。
5. 環(huán)境
人工智能會(huì)傷害還是幫助實(shí)現(xiàn)凈零努力?
鑒于他們對(duì)自然世界的理解愿望,許多科學(xué)家長(zhǎng)期以來(lái)一直活躍在保護(hù)環(huán)境的努力中,從提供關(guān)于氣候變化的早期證據(jù)到開(kāi)發(fā)光伏電池。近年來(lái),越來(lái)越多的科學(xué)家對(duì)AI對(duì)環(huán)境的潛在影響表示擔(dān)憂,并開(kāi)發(fā)了方法來(lái)嘗試量化這些影響。大多數(shù)關(guān)注集中在訓(xùn)練和使用LLM對(duì)溫室氣體排放的潛在影響上,以及與此相關(guān)的擔(dān)憂,如冷卻數(shù)據(jù)中心所需的水資源。思考這些影響的一種方式是生命周期方法,它涵蓋了直接和間接影響。直接影響包括建造和為AI模型訓(xùn)練和運(yùn)行的數(shù)據(jù)中心和設(shè)備供電的排放。沒(méi)有全面的估計(jì)所有直接排放來(lái)自AI。
然而,2021年的一項(xiàng)估計(jì)表明,云和超大規(guī)模數(shù)據(jù)中心,許多大型AI模型在這里訓(xùn)練和部署,占全球排放量的0.1-0.2%。
隨著LLM的規(guī)模繼續(xù)增長(zhǎng),觀察家警告說(shuō),這些數(shù)字可能會(huì)增加,可能顯著增加。然而,包括科學(xué)家在內(nèi)的許多LLM用戶將能夠微調(diào)它們,或者以相對(duì)較低的計(jì)算成本使用它們的預(yù)測(cè),而不是從頭開(kāi)始訓(xùn)練它們。還在進(jìn)行努力使LLM更有效,數(shù)字技術(shù)的歷史表明,可能獲得相當(dāng)大的增益,尤其是由于提供更快、更便宜的AI模型的商業(yè)壓力。在某些情況下,AI模型的排放將低于其他方法。例如,我們的內(nèi)部分析表明,實(shí)驗(yàn)確定少量(<10)蛋白質(zhì)的結(jié)構(gòu)使用的能源與AlphaFold 2的完整訓(xùn)練運(yùn)行大致相同。這些結(jié)果需要仔細(xì)解釋,因?yàn)锳I模擬依賴于,并通知物理實(shí)驗(yàn),而不是替代它們。但它們也展示了AI如何使更多的科學(xué)活動(dòng)以更低的平均能源成本成為可能。
至關(guān)重要的是,AI對(duì)排放的直接影響,無(wú)論是積極的還是消極的,可能與AI啟用的應(yīng)用程序?qū)ε欧诺拈g接影響相比都是次要的。在科學(xué)中使用AI開(kāi)辟了三個(gè)主要機(jī)會(huì)來(lái)減少排放。首先,AI、數(shù)學(xué)和計(jì)算機(jī)科學(xué)之間的進(jìn)展可能顯著提高互聯(lián)網(wǎng)的效率,從設(shè)計(jì)更有效的芯片到尋找例行任務(wù)的更有效算法。隨著越來(lái)越多的經(jīng)濟(jì)體在線移動(dòng),這應(yīng)該有助于抵消這些部門(mén)的排放。AI可以加速可再生能源的開(kāi)發(fā)和使用,例如通過(guò)設(shè)計(jì)新材料,如電池或太陽(yáng)能電池板,通過(guò)優(yōu)化電網(wǎng)的運(yùn)行以及它如何整合可再生能源,以及通過(guò)更變革性但不確定的機(jī)會(huì),如聚變。最后,世界已經(jīng)變得更暖和,AI可以幫助更好地準(zhǔn)備極端天氣事件。例如,我們的天氣預(yù)報(bào)模型最近正確預(yù)測(cè),七天前,致命的颶風(fēng)Beryl將在德克薩斯州登陸。非AI模型最初預(yù)測(cè)在墨西哥登陸,然后在它發(fā)生前三天糾正他們的預(yù)測(cè)到德克薩斯州。
Part D: 政策響應(yīng)
鑒于科學(xué)進(jìn)展對(duì)幾乎每一個(gè)主要的經(jīng)濟(jì)、環(huán)境和安全目標(biāo)都至關(guān)重要,因此科學(xué),以及AI加速它的潛力,應(yīng)該是任何政府的首要任務(wù)。一個(gè)新的AI for Science政策議程應(yīng)該是什么樣子?政策制定者可以開(kāi)始實(shí)施許多已經(jīng)存在的良好科學(xué)和創(chuàng)新政策理念,在AI啟用的科學(xué)時(shí)代,這些理念甚至更有意義。例如,AI將提高科學(xué)研究資金的回報(bào),因此它為投資更多提供強(qiáng)有力的理由,并嘗試新的想法,以加快和實(shí)驗(yàn)如何分配這些資金。在計(jì)算方面,政府可以實(shí)施英國(guó)獨(dú)立審查中提出的想法,授權(quán)一個(gè)專門(mén)機(jī)構(gòu)不斷評(píng)估和建議政府可能的投資。為了支持AI for Science初創(chuàng)公司,政策制定者可以改善他們的衍生政策,并支持管理良好的初創(chuàng)公司孵化器和獎(jiǎng)學(xué)金。
但也需要雄心勃勃的新政策來(lái)利用AI for Science的機(jī)會(huì)。我們下面分享四個(gè)想法。它們旨在廣泛適用,盡管確切的細(xì)節(jié)需要根據(jù)國(guó)家的具體背景進(jìn)行調(diào)整,考慮到國(guó)家優(yōu)先事項(xiàng)、獨(dú)特優(yōu)勢(shì)和制度環(huán)境。
1. 為AI在科學(xué)中定義“希爾伯特問(wèn)題”
科學(xué)進(jìn)展取決于選擇正確的問(wèn)題。在1900年,德國(guó)數(shù)學(xué)家大衛(wèi)·希爾伯特發(fā)表了23個(gè)未解決的問(wèn)題,這些問(wèn)題被證明對(duì)20世紀(jì)數(shù)學(xué)的方向產(chǎn)生了巨大影響。作為即將到來(lái)的國(guó)際事件的一部分,如巴黎的AI行動(dòng)峰會(huì),政策制定者、AI實(shí)驗(yàn)室和科學(xué)資助者可以發(fā)起一個(gè)公眾呼吁,讓科學(xué)家和技術(shù)專家識(shí)別最重要的AI塑造的科學(xué)問(wèn)題,由一個(gè)新的全球基金支持,以推動(dòng)這些問(wèn)題的進(jìn)展。提交應(yīng)該指定為什么問(wèn)題很重要,為什么它適合現(xiàn)代AI系統(tǒng),為什么它可能被忽視,存在的數(shù)據(jù)瓶頸,以及如何評(píng)估近期技術(shù)進(jìn)展。
最佳理念可以形成新的科學(xué)競(jìng)賽的基礎(chǔ),科學(xué)家們競(jìng)爭(zhēng)使用AI解決這些問(wèn)題,支持新的數(shù)據(jù)集、評(píng)估方法和競(jìng)爭(zhēng)基準(zhǔn)。這些可以建立在最近出現(xiàn)的評(píng)估AI模型科學(xué)能力的競(jìng)賽的熱潮之上,并包括一個(gè)新的AI for Science奧林匹克,吸引來(lái)自世界各地的杰出年輕人才進(jìn)入該領(lǐng)域。除了其直接影響,AI for Science“希爾伯特問(wèn)題”倡議可以為國(guó)際科學(xué)合作和資助提供一個(gè)受歡迎的焦點(diǎn),并激勵(lì)新一代的跨學(xué)科科學(xué)家識(shí)別和追求AI塑造的問(wèn)題。
2. 使世界對(duì)科學(xué)家可讀
大多數(shù)科學(xué)數(shù)據(jù)未被收集、部分、未管理或無(wú)法訪問(wèn),使其無(wú)法用于訓(xùn)練AI模型。沒(méi)有單一的政策回應(yīng)遠(yuǎn)遠(yuǎn)不是統(tǒng)一的挑戰(zhàn)。政策制定者和資助者需要將少數(shù)自上而下的舉措與擴(kuò)大有希望的基層努力的支持相結(jié)合。應(yīng)該建立一個(gè)新的AI for Science Data Observatory國(guó)際網(wǎng)絡(luò),以幫助解決這些目標(biāo)。這些天文臺(tái)可以長(zhǎng)期支持,并任務(wù)是運(yùn)行快速的AI for Science“數(shù)據(jù)庫(kù)存”,其中專家團(tuán)隊(duì)繪制優(yōu)先學(xué)科和應(yīng)用領(lǐng)域的數(shù)據(jù)狀態(tài)。庫(kù)存可以識(shí)別現(xiàn)有的數(shù)據(jù)集,如序列讀取存檔,其質(zhì)量可以進(jìn)一步提高,以及未開(kāi)發(fā)或未充分利用的數(shù)據(jù)集,如目前對(duì)科學(xué)家或領(lǐng)先的生物多樣性數(shù)據(jù)不可用的數(shù)十年的實(shí)驗(yàn)聚變數(shù)據(jù),這些數(shù)據(jù)受到限制性許可條件的制約。庫(kù)存還可以包括新的“數(shù)據(jù)愿望清單”。例如,我們的內(nèi)部分析表明,不到7%的關(guān)鍵環(huán)境研究領(lǐng)域的論文使用AI。我們最近資助了Climate Change AI,以識(shí)別如果可用或改進(jìn),可以消除更多AI使用瓶頸的數(shù)據(jù)集。為確保這一分析導(dǎo)致行動(dòng),政策制定者應(yīng)指定和授權(quán)組織負(fù)責(zé)解決數(shù)據(jù)庫(kù)存的結(jié)果。
天文臺(tái)還可以規(guī)劃創(chuàng)建新的數(shù)據(jù)庫(kù),包括確保充分考慮其長(zhǎng)期存儲(chǔ)、維護(hù)和激勵(lì)措施。這可能包括新數(shù)據(jù)庫(kù),以安全存儲(chǔ)當(dāng)前丟棄的戰(zhàn)略濕實(shí)驗(yàn)室實(shí)驗(yàn)的結(jié)果,輔以使這些實(shí)驗(yàn)結(jié)果的沉積成為公共研究資金的要求?;驍?shù)字化更多的公共檔案,遵循英國(guó)政府和自然歷史博物館最近合作數(shù)字化其自然歷史收藏的例子,其中包含超過(guò)1.37億件物品,從蝴蝶到豆科植物,跨越46億年的歷史。政策制定者還可以授權(quán)科學(xué)家使用LLM創(chuàng)建和改進(jìn)自己的數(shù)據(jù)集,確保公共資助的研究默認(rèn)情況下是開(kāi)放的,盡可能,建立在英國(guó)、美國(guó)和日本最近的示例之上,包括通過(guò)預(yù)印本服務(wù)器發(fā)布研究的授權(quán)。政策制定者可以尋求與行業(yè)和慈善事業(yè)共同資助最雄心勃勃的數(shù)據(jù)集舉措。
3. 教授AI作為下一個(gè)科學(xué)儀器
在過(guò)去的半個(gè)世紀(jì)中,隨著科學(xué)技術(shù)的數(shù)量增長(zhǎng),大多數(shù)科學(xué)家與它們的距離也在增長(zhǎng)。許多技術(shù)是科學(xué)的產(chǎn)物,但越來(lái)越少的科學(xué)家接受過(guò)如何有效地開(kāi)發(fā)和使用它們的培訓(xùn)。迫切的近期需求是資助和激勵(lì)更短的、更戰(zhàn)術(shù)性的AI培訓(xùn)計(jì)劃和獎(jiǎng)學(xué)金,針對(duì)現(xiàn)有的科學(xué)家和研究領(lǐng)導(dǎo)者。政策制定者可以通過(guò)設(shè)定一個(gè)明確的目標(biāo)來(lái)激勵(lì)這些努力,即每個(gè)研究生科學(xué)學(xué)生都應(yīng)該能夠接受有關(guān)在科學(xué)中使用AI的入門(mén)課程,包括他們領(lǐng)域最重要的工具,就像今天通常教授基礎(chǔ)統(tǒng)計(jì)學(xué)一樣。所需的培訓(xùn)類型和深度將取決于個(gè)人的學(xué)科和個(gè)人資料,可能從基本的入門(mén)課程,了解如何可靠地使用LLM進(jìn)行日常研究任務(wù),到更高級(jí)的課程,了解如何在科學(xué)數(shù)據(jù)上微調(diào)AI模型,以及如何解決更復(fù)雜的挑戰(zhàn),如評(píng)估他們用來(lái)測(cè)試模型性能的數(shù)據(jù)是否故意或無(wú)意地“泄露”到用于訓(xùn)練它的數(shù)據(jù)中。
這些計(jì)劃可以建立在既定的例子之上,如劍橋大學(xué)的Accelerate計(jì)劃,為博士和博士后研究人員提供結(jié)構(gòu)化的AI培訓(xùn),或The Carpentries提供的短期課程,涵蓋進(jìn)行研究所需的編程、數(shù)據(jù)和計(jì)算技能。
政策制定者還需要迅速采取行動(dòng),確保下一代科學(xué)家擁有他們需要的技能。這意味著將AI培訓(xùn)和技能發(fā)展納入所有級(jí)別的科學(xué)教育主流。中學(xué)科學(xué)學(xué)生將需要早期接觸AI的影響,而大學(xué)生將需要獲得新的跨學(xué)科AI科學(xué)學(xué)位的機(jī)會(huì),如我們與非洲數(shù)學(xué)科學(xué)研究所合作開(kāi)發(fā)的泛非AI for Science碩士課程。還可以提供專門(mén)的獎(jiǎng)學(xué)金。例如,英國(guó)的BIG獎(jiǎng)學(xué)金計(jì)劃為高中學(xué)生提供了杰出的機(jī)會(huì),重點(diǎn)是那些在國(guó)際科學(xué)奧林匹克競(jìng)賽中表現(xiàn)出色的來(lái)自代表性不足群體的學(xué)生,他們希望繼續(xù)在領(lǐng)先的科學(xué)中心學(xué)習(xí),但缺乏資金。
4. 建立證據(jù)并嘗試新的科學(xué)組織方式
科學(xué)家對(duì)AI的使用呈指數(shù)級(jí)增長(zhǎng),但政策制定者幾乎沒(méi)有證據(jù)表明誰(shuí)做得最好,他們?nèi)绾巫觯约白璧K他人的障礙。這種證據(jù)差距是確定最佳AI for Science政策理念并有效針對(duì)它們的障礙。歷史上,這些問(wèn)題的答案通常來(lái)自經(jīng)濟(jì)學(xué)或創(chuàng)新研究領(lǐng)域,但結(jié)果可能需要數(shù)年才能到來(lái)。我們使用引文數(shù)據(jù)分析、訪談和社區(qū)參與來(lái)了解科學(xué)家如何使用我們的AI模型。政府也在投資這些元科學(xué)能力,以改善他們資助、共享和評(píng)估科學(xué)研究的方式。在此基礎(chǔ)上,科學(xué)家可以被賦予一個(gè)任務(wù),快速評(píng)估基礎(chǔ)政策問(wèn)題,包括:最有影響力的AI for Science研究發(fā)生在哪里,哪些類型的組織、人才、數(shù)據(jù)集和評(píng)估使其成為可能?科學(xué)家在多大程度上使用和微調(diào)LLM與更專業(yè)的AI模型,以及他們?nèi)绾卧L問(wèn)這些模型?AI實(shí)際上在多大程度上有益于或損害了科學(xué)創(chuàng)造力、可靠性、環(huán)境或其他領(lǐng)域?AI如何影響科學(xué)家對(duì)他們的工作的看法,以及哪些技能、知識(shí)差距或其他障礙阻止了他們更廣泛地使用AI?
除了為堅(jiān)實(shí)的政策回應(yīng)提供信息外,這個(gè)證據(jù)基礎(chǔ)還將為政策制定者提供他們需要的先見(jiàn)之明,以預(yù)測(cè)AI如何轉(zhuǎn)變科學(xué)和社會(huì),類似于他們通過(guò)不斷增長(zhǎng)的AI安全研究所網(wǎng)絡(luò)為AI安全風(fēng)險(xiǎn)發(fā)展的先見(jiàn)之明。證據(jù)還將突出重新構(gòu)想科學(xué)在AI時(shí)代所需的激勵(lì)和機(jī)構(gòu)的機(jī)會(huì)。特別是,科學(xué)家和政策制定者只探索了一小部分可能的科學(xué)研究組織和執(zhí)行方法。AI的興起提供了一個(gè)受歡迎的強(qiáng)制功能,以嘗試新的機(jī)構(gòu)類型,從那些有更多自由追求高風(fēng)險(xiǎn)、高回報(bào)研究的機(jī)構(gòu),到旨在解決特定瓶頸的專注研究組織。以及新的跨學(xué)科AI科學(xué)研究所在優(yōu)先領(lǐng)域,如氣候或糧食安全,以及我們尚未想象的完全新型機(jī)構(gòu)。那些更快嘗試的人將從新的發(fā)現(xiàn)黃金時(shí)代中獲益最多。
.END.
圖片來(lái)源|網(wǎng)絡(luò)