2024年11月,谷歌旗下人工智能公司Deepmind發布《科學發現的新黃金時代:抓住人工智能輔助科學的機遇》(A New Golden Age of Discovery: Seizing the AI for Science Opportunity)報告,探討了人工智能在科學研究中的應用機遇、要素、風險挑戰及政策議程。報告指出,人工智能的應用不僅能夠加速科學發現,還能推動社會進步,但同時也面臨諸多挑戰,如對科學創造力、可靠性和理解的潛在影響等。報告建議,政策制定者應通過定義人工智能在科學中的關鍵問題、優化數據管理、加強人工智能教育和推動新型科學組織等方式,迎接人工智能賦能科學的黃金時代。
一、人工智能應用于科學研究的五大機遇
(一)科學知識的管理與傳播
為了取得新發現,科學家需要掌握一個不斷擴展且日益專業化的知識體系,這解釋了為何作出變革性發現的科學家多數是年長、跨學科的,并集中在頂尖大學。在以前,多數科學家們通過晦澀難懂、充滿專業術語的論文分享研究成果,這可能降低決策者、企業和公眾對其工作的興趣。如今,科學家們已經開始使用基于大語言模型的科學助手,例如通過Gemini大語言模型可在一天內從20萬篇論文中提取并篩選最相關的數據。未來,隨著大語言模型的微調和改進,科學家們將能夠更高效地整合和傳播知識。
(二)科學數據的收集、標注與生成
人工智能可以提升現有數據收集的準確性,例如,它可以減少DNA測序、檢測樣本中的細胞類型或捕捉動物聲音時產生的噪音和錯誤。科學家還可以利用大語言模型的能力,提取科學出版物、檔案以及教學視頻等資源中隱藏的非結構化科學數據,并將其轉換為結構化數據集。人工智能還可以為科學數據添加標注,提供科學家使用數據所需的支持信息。此外,經驗證的人工智能模型還能生成新的合成科學數據,通過對其他數據的補充,為科學數據發展提供有力支持。
(三)科學實驗的模擬和優化
許多科學實驗成本高昂、過程復雜且進展緩慢。人工智能可以幫助模擬和優化實驗。以人類DNA中的錯義變異為例,Deepmind的AlphaMissense模型可將7100萬個潛在變異中的89%分類為無害或有害,幫助科學家聚焦于高風險變異來進行實驗,從而提高研究效率。人工智能模擬實驗并非替代物理實驗,而是為其提供指導和優化,推動科學研究的高效發展。
(四)復雜系統的建模和仿真
傳統數學模型在描述生物、經濟、氣象等復雜系統時面臨維度災難、混沌特性和突發行為等根本性挑戰,人工智能的出現則為解決這一難題帶來新曙光。以天氣預報為例,傳統數值方法雖有用但存在局限性,而深度學習系統在2023年實現了更準確、快速的10天氣候預測,甚至助力應對氣候變化。人工智能與基于智能體的建模相結合,通過生成智能體和強化學習,模擬經濟系統中個體行為的動態變化,為復雜系統提供更靈活、精準的模擬方式。未來,人工智能將在豐富拓展傳統方法的基礎上推動復雜系統研究的突破。
(五)科學問題的解決方案
在科學研究中,許多領域仍有許多潛在待探索的解決方案,例如設計小分子藥物或蛋白質結構時,傳統方法難以有效探索這些解決方案,而人工智能可以更快地鎖定最可行的解決方案。例如,DeepMind的AlphaProof和AlphaGeometry 2系統在國際數學奧林匹克競賽中成功解決了數學問題,展現了強大的推理能力。這些系統基于Gemini 大語言模型架構,通過生成大量新想法并結合數學邏輯逐步篩選,高效鎖定可行的解決方案。人工智能為分子設計、數學證明等復雜問題開辟了新的探索路徑,顯著提升了研究效率,為科學研究帶來了前所未有的機遇。
二、人工智能助力科學研究的九大要素
(一)問題選擇
科學進展依賴于能夠識別一個重要問題并提出解決它的正確思路。許多時候,一個問題在理論上適合人工智能,但由于實際條件尚未到位,因此需要暫時擱置。除了選擇正確的問題,明確其合適的難度層次也很重要。如果選擇一個過于困難的問題,就無法產生足夠的反饋或數據來推動進展。要做到這一點,需要結合直覺判斷和不斷嘗試的實踐過程。
(二)評估
科學家們通過基準測試、指標和競賽等評估方法來衡量人工智能模型的科學能力。如果這些評估方法運用得當,可以用于跟蹤進展、激勵方法創新,并激發研究人員對科學問題的興趣。通常情況下,需要多種評估方法來綜合衡量模型的表現。最具影響力的“人工智能驅動的科學研究”評估方法通常是由社區主導或認可的。例如,“蛋白質結構預測關鍵評估”(CASP)競賽。該競賽不僅成為了一個獨特的全球科研社區,也成為了推動研究進步的催化劑。社區認可的需求也支持了發布基準測試的必要性,以便研究人員能夠使用、評估和改進這些測試。此外,科學家、人工智能實驗室和政策制定者還應探索評估人工智能模型科學能力的新方式,比如建立新的第三方評估機構、舉辦競賽,以及讓科學家更自由地對人工智能模型能力進行開放性探索。
(三)算力
多項政府審查已認識到算力資源在推動人工智能、科學及更廣泛經濟領域發展的重要性。人工智能實驗室和政策制定者應采取務實的、長期的視角,考慮人工智能模型和具體應用場景的不同算力需求,以及與不依賴人工智能的科學進步方法相比的效益。此外,人工智能實驗室和政策制定者需要通過實證手段跟蹤算力資源的使用情況,了解其演變趨勢,并預測這些趨勢對未來需求的影響。
(四)數據
數據與算力一樣,是人工智能科學研究的關鍵基礎,需要持續開發和更新。自上而下的數據項目(如美國奧巴馬政府發起的材料基因組計劃)為科學研究提供了重要基礎,但許多突破性進展依賴于個人或小團隊生成的數據。例如,gnomAD遺傳變異數據集和Lean編程語言的成功,展示了個體努力的價值。然而,數據管理存在諸多問題:部分數據因缺乏資金和標準而被丟棄或未被充分利用;數據許可限制和不一致的存儲標準也阻礙了人工智能的應用。因此,需要結合自上而下的規劃和激勵機制,鼓勵個人參與數據管理各階段工作,確保數據的高質量、可訪問性和可持續性。
(五)組織設計
學術界和工業界在科研方向上分別呈現自下而上和自上而下的特點。近年來,新的科研機構不斷涌現,它們在目標、資金模式和研究方向上各具特色,但共同追求高風險、高回報的研究。這些機構聚焦于應用人工智能或解決特定科學問題,試圖在自上而下的協調和自下而上的科學家賦權之間找到平衡,例如,一些機構通過設定里程碑聚焦特定問題,而另一些則給予研究者更多自由資金,這種平衡對吸引和留住研究帶頭人至關重要。
(六)跨學科合作
許多復雜科學問題需要跨學科合作,但研究人員在多學科團隊中往往難以突破學科壁壘。為了培養這種合作,研究團隊應為其研究人員創造融合學科的角色和職業路徑。此外,還需鼓勵研究人員定期更換項目,促進思想交流,并營造好奇心、謙遜和包容的文化,以推動不同背景的研究人員能夠在公開討論中評價彼此的工作。
(七)可信使用
為了讓科學家信任并使用人工智能科學模型,必須明確其使用方式和潛在的安全風險。因此,開發人員在發布模型時需平衡科學推廣、商業目標和安全風險。為此,Deepmind創建了一個“影響力加速器”計劃以推動突破性應用。以AlphaFold 2為例,為促進科學家使用,Deepmind開源了代碼并與歐洲生物信息研究所合作開發數據庫,方便科學家獲取蛋白質結構。AlphaFold 3進一步擴展了模型的能力,催生了AlphaFold Server等新工具,滿足多樣化需求,同時強調培養科學界計算技能的重要性。
(八)公私合作
人工智能驅動的科學研究工作需要公私合作,以整合多樣化專業知識。合作需要貫穿項目全周期,從數據集創建到成果共享,尤其在人工智能模型評估中,科學家的專業知識不可或缺。例如,材料科學家對人工智能預測的新材料進行評估,蛋白質設計團隊與研究機構合作驗證人工智能設計蛋白的功能。然而,建立合作關系面臨挑戰,如目標對齊、成果權利、開源與許可等問題。此外,成功的合作還需明確價值交換規則,發揮各方優勢。
(九)安全與責任
科學家對人工智能模型的潛在益處和風險存在分歧,倫理和安全評估有助于討論并指導人工智能模型的開發。評估的起點是識別關鍵影響領域,同時還需對其可能影響的時間范圍以及人工智能在實現這些影響中的重要程度進行評估。目前,許多人工智能的安全評估主要依賴于明確指出模型不應輸出的內容類型,這些安全評估對由人工智能在科學研究中引發的風險(如生成不準確內容)是有用的。但對于其他風險(如生物安全風險),我們能否提前認定“某些科學知識是危險的”這一想法已經受到了質疑。事實上,科學知識具有“兩面性”,它既可用于有益的方面,也可被用于有害的方面。未來應評估人工智能模型的危險程度及其危害人類的能力,并結合威脅行為者分析和訪問管理來判斷風險程度。
三、人工智能在科學研究中面臨的五大風險挑戰
(一)創造力的同質化
科學創造力指的是創造既新穎又有用的東西。目前,一些科學家擔心,人工智能系統往往專注于特定任務,依賴它們可能會忽視偶然的突破。還有人擔心,如果科學家普遍使用人工智能,可能導致研究輸出趨于同質化。為緩解上述這些風險,科學家可以通過個性化調整人工智能的使用方式,促進自己的創造力。例如,通過微調大語言模型來提出個性化的研究思路,或幫助科學家引導出自己的創意。
(二)科學研究的可靠性下降
科學研究的可靠性是指科學家能依賴彼此的研究結果,并確保這些結果并非偶然或錯誤的。目前,科學研究的可靠性面臨一系列挑戰,如統計錯誤和科學欺詐問題。一些科學家擔心人工智能會加劇這些問題,尤其是大語言模型可能產生虛假或誤導性輸出。還有人擔心大語言模型會產生大量低質量論文。為應對這些問題,科研界正在推動人工智能在事實核查方面的研究,旨在通過驗證模型輸出的準確性,確保其生成的內容更加可靠。
(三)理解深度受限
科學家擔心,人工智能依賴模式匹配而忽視深入理解,這可能會削弱科學進步。事實上,人工智能在數據集構建和評估中融入了先驗知識,一些模型還具備可解釋性輸出,例如FunSearch方法不僅輸出代碼,還解釋其解決方案的形成過程。人工智能還能通過開辟新的研究方向促進科學理解,例如,AlphaFold通過生成大量合成蛋白質結構,幫助科學家發現Cas13蛋白家族的新成員,挑戰了之前的進化假設。盡管準確性與可解釋性之間可能存在權衡,但人工智能的不透明性可能源于其在高維空間的運行能力,這種能力雖難以解釋,卻可能是實現科學突破的關鍵。
(四)社會公平失衡
科學研究領域存在顯著的不公平現象,包括研究資源、數據和成果的分布不均等。例如,高收入地區少數實驗室主導科學成果,熱帶疾病和低收入國家的農業問題常常被忽視,女性和少數族裔科學家代表性不足等。一些科學家擔心,人工智能在科學領域的應用日益增多,可能會加劇這些不平等現象。然而,人工智能也為改善公平性提供了機會。通過低成本工具和更廣泛的數據接入,人工智能可以幫助研究被忽視的問題。例如,基于更大、更多樣化的數據集訓練的人工智能模型在預測疾病風險時表現出更好的準確性和公平性。
(五)環境影響爭議
近年來,越來越多的科學家對人工智能可能對環境產生的影響表示擔憂。主要關注點集中在大語言模型訓練和使用過程中的溫室氣體排放以及冷卻數據中心所需的水資源。生命周期評估方法可用于分析這些直接和間接影響。目前,數據中心和人工智能模型的直接排放僅占全球排放量的0.1-0.2%,但隨著大語言模型規模擴大,排放可能增加。然而,通過微調和提高效率,未來大語言模型的能耗有望降低。在某些情況下,人工智能模型的排放量甚至低于傳統方法,例如AlphaFold 2的訓練能耗與實驗確定少量蛋白質結構的能耗相當。
四、人工智能驅動的科學時代下的政策議程
(一)為科學中的人工智能定義“希爾伯特問題”
1900年,德國數學家大衛·希爾伯特提出的23個數學問題深刻影響了20世紀數學的發展。如今,為推動人工智能科學進步,國際社會呼吁科學家和技術人員提出關鍵的人工智能科學問題,并由全球基金支持解決。這些問題需明確其重要性、數據瓶頸及評估方法等方面。通過新數據集、評估方法和競賽基準,頂尖想法可成為科學競賽的基礎,如人工智能科學奧林匹克競賽,吸引全球青年人才。該倡議不僅直接推動技術發展,還能協調國際科學合作與投資,激勵跨學科科學家共同探索人工智能的未來。
(二)建立“人工智能科學數據觀測站”網絡
當前多數科學數據存在未收集、不完整等問題,難以用于人工智能模型訓練。為此,政策制定者可以建立一個國際性的“人工智能科學數據觀測站”網絡,以解決這些問題。觀測站要開展“數據盤點”,繪制數據狀況圖,明確數據集優先級,確定新數據庫創建范圍等。政策制定者還應借鑒相關國家經驗,推動公共資助研究成果的開放,與產業界等共同資助數據集計劃,以解決數據問題,推動人工智能在科學領域更好應用。
(三)將人工智能融入科學教學
隨著科學技術的發展,科學家與技術的距離卻在拉大。為解決這一問題,需為現有科學家提供資金支持,鼓勵他們參與短期、戰術性的人工智能培訓計劃和獎學金。政策制定者應設定目標,讓每個理科研究生都能獲得人工智能入門課程。培訓內容需根據學科和情況定制,從基礎的大語言模型使用到高級的模型微調,再到應對數據泄露等復雜挑戰。同時,政策制定者需制定長期計劃,將人工智能培訓納入各級科學教育環節,如讓中學生了解人工智能的影響,大學生獲得跨學科人工智能學位。設立專門獎學金如英國“BIG獎學金”,為培養下一代科學家提供支持。
(四)收集證據并嘗試新的科學組織方式
科學家使用人工智能的速度正在迅速增長,但政策制定者對誰在最有效地使用它、如何使用以及有哪些障礙正在阻礙其他人的使用等情況,知之甚少。目前,Deepmind正在通過引文數據分析、訪談和社區互動,了解科學家如何使用Deepmind的模型。這一證據基礎將為政策制定者提供決策依據,幫助他們預測人工智能如何改變科學與社會,以及如何優化科學激勵機制設計。此外,人工智能的崛起為新型科研機構的試驗提供了機遇,從高風險高回報的研究機構到解決特定瓶頸問題的重點組織,甚至全新的跨學科機構。誰能更快地進行實驗,誰就能在科學發現的黃金時代獲益最多。
文章來源于啟元洞見 ,作者啟元洞見;圖片來源網絡 侵刪
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學習參考;
2、本站屬于非營利性網站,如涉及版權和名譽問題,請及時與本站聯系,我們將及時做相應處理;
3、歡迎各位網友光臨閱覽,文明上網,依法守規,IP可查。
作者 相關信息
內容 相關信息
? 昆侖專題 ?
? 高端精神 ?
? 新征程 新任務 新前景 ?
? 習近平治國理政 理論與實踐 ?
? 國策建言 ?
? 國資國企改革 ?
? 雄安新區建設 ?
? 黨要管黨 從嚴治黨 ?