【"朱批藍批"編者按】
5月9日,"朱批藍批"公眾號推送了十四屆全國人大常委會第十講專題講座1萬余字的《全國人大常委會專題講座稿全文:人工智能與智能計算的發展》,以便社會各界的讀者學習參考。截至5月11日中午,已經突破2萬人閱讀該圖文。
其實,內參君李朱最近計劃邀約一些兩院院士手寫寄語,選編一組探討人工智能的講座內容等,分享給有心師友們學習。 早在2018年10月31日下午,十九屆中央政治局就人工智能發展現狀和趨勢舉行第九次集體學習,中國工程院院士高文教授就這個問題作了講解,并談了意見和建議。今天,內參君李朱特別找來了高文院士在《黨委中心組學習》上最新發表的、刪減后全文約1.2萬字的、標題為《人工智能前沿技術和高質量發展解析》的精彩重磅文章。 高文院士1.2萬字文章的主體框架如下:
一、世界人工智能發展歷程和方向——大勢所趨
(一)人工智能發展歷程
(二)當前人工智能發展新趨勢
(三)世界大國加快人工智能戰略與政策部署
二、中國人工智能發展現狀和前景——大有可為
(一)我國人工智能基礎理論和部分關鍵技術實現突破,人工智能與經濟社會融合不斷深入
(二)中美引領大模型發展,我國語言大模型與美國差距正在逐步縮小,視覺、多模態、具身等新一代大模型有望實現齊頭并進
(三)我國人工智能整體發展已進入全球第一梯隊
(四)我國人工智能發展的優勢條件
(五)我國人工智能發展的薄弱環節
三、全面推進中國人工智能高質量發展——勇毅前行
(一)持續完善我國人工智能規劃和政策體系
(二)加強通用人工智能基礎理論研究和關鍵技術研發
(三)夯實人工智能基礎軟硬件生態底層基礎
(四)加強數據、算力等資源的匯聚及共享
(五)加強人工智能風險預判和治理體系建設
(六)強化人工智能在服務企業升級中發揮更大作用
(七)加強人工智能教育和人才培養
(八)加強人工智能國際交流與合作
人工智能前沿技術和高質量發展解析
高文
(中國工程院院士)
一、世界人工智能發展歷程和方向——大勢所趨
人工智能(Artificial Intelligence,簡稱AI)是指,在機器上實現相當乃至超越人類的感知、認知、行動等智能。按照智能能力的不同,人工智能通常可分為通用人工智能和專用人工智能,或被稱為強人工智能和弱人工智能。目前對通用人工智能有兩種理解:一種是通用性的人工智能(簡稱GAI)是媒體和社會公眾的一般理解,指的是能夠處理很多任務的智能;另一種則是人工智能專業領域的準確名稱,即人工通用智能(簡稱AGI),是指在人工智能所有方面都達到人類水平,能夠自適應地應對外界環境挑戰,完成人類能完成的所有任務的人工智能。
長期以來,人工智能系統都是為了實現特定或專用目標任務的智能,屬于弱人工智能或專用人工智能范疇。2018年以來,大規模預訓練模型(簡稱大模型)通過在海量無標注數據上依托強大算力資源訓練能適應一系列下游任務,實現了通用性的人工智能(GAI),拉開了通用人工智能的序幕,但當前仍沒有達到真正的人工通用智能(AGI)。
(一)人工智能發展歷程
人工智能的概念最早于1956年在美國達特茅斯學院召開的夏季研討會上被正式提出。縱觀人工智能近70年的發展歷程,大體上可分為三個階段。
第一階段以符號主義邏輯推理證明為中心。該階段主要研究在形式化表示方法基礎上,通過邏輯推理或啟發式程序來模擬人類推理能力,解決代數應用題求解、幾何定理證明和機器翻譯等問題。
第二階段是以人工規則的專家系統為核心。該階段的研究焦點就是將領域專家的知識歸納成人工規則,進而進行輔助決策,專家系統技術在這一時期得到快速發展。
第三階段是以大數據驅動的深度學習為核心。該階段有效整合算法、算力和數據,推動人工智能的研究重心從如何“制造”智能轉移到如何“習得”智能。
2006年,加拿大多倫多大學杰弗里•辛頓教授提出“深度學習算法”,為新一輪人工智能的發展奠定了理論和方法基礎。
2012年,杰弗里•辛頓教授與學生提出的深度學習神經網絡模型AlexNet在ImageNet圖像識別挑戰賽上以巨大的優勢擊敗了其他非神經網絡模型,成為深度學習興起的標志。
2016—2021年,谷歌開發的系列圍棋機器人AlphaGo和AlphaZero,不僅在比賽中先后戰勝了世界冠軍李世石和柯潔,后來還取得了擂臺賽不敗的戰績。
同時,該公司研發的AlphaFold2在蛋白質結構預測問題上達到接近人類實驗解析的水平,解決了困擾生物學界50年的“蛋白質折疊”難題。
近10年來,基于大數據的深度學習模型和算法得到大規模應用,在機器翻譯、智能問答、博弈對抗等領域取得了巨大成功,人工智能進入加速發展期。
以上三個階段中,前兩個階段的主要思路是設計新的理論和算法,用機器模擬人的智能,盡管在理論方法上取得了進展,但由于目標過高,與應用結合不夠,使得人工智能發展幾經起伏。第三階段基于大數據的深度學習技術已成為當前人工智能的主流發展路徑,在計算機視覺、自然語言處理、智能語音等技術領域實現了規模應用。
其中,計算機視覺是人工智能技術中應用最為廣泛的領域。計算機視覺是指,通過計算機對圖像或視頻進行處理,使其能夠自動識別、分析和理解圖像或視頻中的信息。
2015年,由微軟亞洲研究院提出的深度殘差學習網絡ResNet成為計算機視覺領域具有里程碑意義的代表性技術。ResNet的出現,使得超過上百層的更深層網絡可以更有效地進行訓練,推動了深度學習技術不斷探索能力極限。目前,ResNet已經成為計算機視覺任務的首選架構,例如圖像分類、物體檢測和圖像分割等。2023年,基于為人工智能作出的基礎性貢獻,ResNet的四位作者獲得了未來科學大獎。
(二)當前人工智能發展新趨勢
2018年以來,大模型首先在自然語言處理領域取得突破,以ChatGPT為代表的現象級產品拉開了通用人工智能的序幕,引發了新一輪人工智能發展浪潮。當前人工智能發展已由小模型時代邁向大模型時代。
大模型是“大數據+大算力+強算法”結合的產物,至少具有三個特點:
一是規模大,神經網絡參數規模要達到百億以上;
二是涌現性,要產生預料之外的新能力,這是人工智能發展近70年來最具里程碑意義的新特性;
三是通用性,能夠解決各類問題。
美國OpenAI公司的GPT(生成型預訓練Transformer模型)系列大模型是當前國際大模型領域的領先代表。2022年11月,OpenAI發布的人工智能對話大模型ChatGPT表現出了驚人的智能水平,能夠長時間進行自然流暢的對話,同時還能夠高質量撰寫幾乎任何類型的書面材料,可以完成很多需要創造性思考的任務,一經發布就受到全球用戶廣泛關注,成為歷史上增長最快的消費應用,引發了人工智能的“iPhone時刻”。
ChatGPT之所以能表現出色,主要歸因于幾個關鍵方面的技術和策略。
第一,其采用了大規模的訓練數據,特別是互聯網文本數據,以捕獲豐富的知識和語言模式。
第二,模型基于高效的Transformer架構,該架構通過自注意力機制,能夠有效處理輸入序列中各位置信息間關聯依賴關系,極為適合自然語言處理任務。
第三,ChatGPT通過多任務學習,提高了其在多樣化問題上的泛化能力和生成能力。
第四,模型還針對特定任務進行了微調,以更好地適應和解決特定領域或場景下的問題。
第五,通過利用強化學習等技術進行模型調優,ChatGPT在特定任務上的輸出更加接近人類的習慣,進而表現得以進一步提升。
這些技術的融合和應用,使ChatGPT成為了文本問答任務中的佼佼者,激發了公眾對強人工智能未來發展的無限遐想。
除語言能力以外,大模型也在迅速擴展視覺、聽覺、具身(有身體的智能,能與環境進行交互)、行動等其他通用智能能力,在向多模態方向發展的同時,也將逐漸進入現實世界,發展實體智能,引發下一波人工智能發展浪潮。
但是,也應看到,大模型等通用人工智能技術在給世界經濟社會發展帶來巨大機遇的同時,也帶來了難以預知的各種風險和復雜挑戰。大模型是高度復雜的人工智能系統,特點是難以預測,當前取得的進展基本上是通過經驗模式取得,大模型背后的智能發生和涌現機理尚不清晰,國際社會對如何構建一個安全的人工智能系統仍知之甚少。
當前以大模型為代表的通用性的人工智能(GAI)已顯現出倫理道德、數據安全等一系列風險,需要加強安全監管。未來,面對伴隨著人工通用智能(AGI)的到來可能會引發的人類生存性風險,更需要嚴加防范。加強通用人工智能治理已成為世界各國面臨的共同問題。
隨著人類探索通用智能發展路徑的越發清晰,全球正處于“AGI”(準強人工智能)的前夜,處在一個不確定性的狀態,未來需要對大模型基礎原理、安全與價值觀對齊、人工通用智能(AGI)風險控制策略等方面開展深入研究,促進人工智能技術造福于人類。
(三)世界大國加快人工智能戰略與政策部署
當前,人工智能已成為國際競爭的新焦點和經濟發展的新引擎,世界主要發達國家把發展人工智能視為提升國家競爭力、維護國家安全的重大戰略,紛紛出臺人工智能規劃和相關政策,力圖在新一輪國際科技競爭中掌握主導權。
各國從國家戰略層面強化人工智能布局。
美國圍繞人工智能研發和國家安全,陸續出臺《國家人工智能研發戰略規劃》等相關戰略和政策,力求鞏固其世界領先優勢。
法國發布《國家人工智能戰略》,著力推動健康、交通、環境、國防安全等領域的智能化。
歐盟自2010年以來就把實現智能增長作為其三大增長目標之一,2018年4月發布了《歐洲人工智能》,系統地提出了歐盟的人工智能發展戰略規劃;同月,發布了《人工智能合作宣言》,標志著歐洲人工智能進入合作發展的新階段。
德國通過《聯邦政府人工智能戰略要點》,提出成為全球領先的人工智能科研場,實現人工智能德國造。
英國發布《國家人工智能戰略》,從數據獲取、人才培養、科技研發和產業應用等方面打造人工智能強國。
俄羅斯發布《2030年前人工智能國家發展戰略》。
日本提出建設“超智能社會5.0”,不僅要提升產業競爭力,還要實現國民生活智能化。
各國競相加大人工智能研發投入。
美國政府2017財年向人工智能非保密項目投入研發經費超過20億美元,在2022年累計投入達249億美元,預計2028年投入將破千億美元;2021財年美國國防預算提案在人工智能研發領域的投資總額為8.41億美元,較2020財年的7.8億美元增長約8%。法國在2022年前在人工智能項目中投資15億歐元。韓國提出要從“IT強國”發展為“人工智能強國”,計劃在2030年將韓國在人工智能領域的競爭力提升至世界前列。
各國組建新型人工智能研發機構。
美國國家科學基金會協同聯邦機構,包括國土安全部、國防部、教育部、農業部等,聯合成立了25家國家人工智能研究院;歐洲計劃建立一所世界級人工智能研究所,在英國等多個歐洲國家設立科研中心;法國提出新建人工智能中心,并組建人工智能研究網絡;英國擴建阿蘭•圖靈研究所,啟動數據倫理與創新中心建設,成立新的人工智能技術學院。全球各大人工智能跨國公司和領軍企業也在加快布局人工智能研發中心。
各國加緊推動人工智能治理體系建設。
聯合國自2018年起專門成立了人工智能與機器人中心,研究人工智能的管控問題;美國國會建議成立人工智能安全委員會,負責對人工智能、機器學習的發展和相關技術開展審查;歐盟簽署《人工智能合作宣言》,發布《歐盟機器人民事法律規則》,共同應對人工智能在倫理、法律等方面的挑戰;2019年起,歐盟持續加強對人工智能應用和治理的關注,于當年4月出臺了《可信賴的人工智能倫理準則》,為實現可信賴的人工智能設定了一個倫理框架。
目前,全球人工智能發展正處于由弱人工智能向強人工智能過渡的階段,人工智能已經成為主導國家戰略競爭力的重要支撐和推動科技革命的重要力量。未來,“人工智能+高速移動互聯”將成為人類社會生活的基本場景。著眼更長遠的未來,強人工智能將會帶來顛覆性、全局性影響,誰率先實現突破,誰就會掌握未來發展的主導權。如果我國在新一輪人工智能發展中落后,將會在全球競爭中處于不利地位。
二、中國人工智能發展現狀和前景——大有可為
習近平總書記指出,“把新一代人工智能作為推動科技跨越發展、產業優化升級、生產力整體躍升的驅動力量,努力實現高質量發展”。2017年,國務院發布《新一代人工智能發展規劃》,確立了人工智能三步走目標,將人工智能上升為國家戰略。此后,相關部委和各地方政府推動《新一代人工智能發展規劃》加快實施,同時,科技界、產業界、投資界協同發力,推動我國人工智能發展進入跨越趕超的關鍵時期。
(一)我國人工智能基礎理論和部分關鍵技術實現突破,人工智能與經濟社會融合不斷深入
經過多年的持續研發布局,我國人工智能科技創新體系逐漸完善,智能經濟和智能社會發展不斷深入,取得顯著成效。
一是人工智能基礎理論快速積淀。
近年來,國內學者在問題求解、演化計算、模式識別、專家系統、智能控制等經典人工智能領域多有建樹。
特別是在新興的深度學習理論和推理算法方面開展了大量研究,例如,北京大學提出深度跨媒體學習方法,顯著提高了跨媒體檢索的準確率;南京大學提出的“深度森林”模型是國際上第一個非神經網絡和BP(反向傳播)算法的深度學習方法。
在類腦計算方面加強布局,類腦芯片、類腦計算系統、類腦應用等取得積極進展;中國科學院在腦機接口領域取得突破,研發了目前運行最快的頭皮腦電(EEG)腦機接口系統。華為公司上線了氣象大模型,在一系列氣象學家關心的精度指標和極端天氣預報中都展現出優勢,具有強大競爭力和巨大潛力。
二是人工智能部分關鍵技術躋身世界先進水平。
本輪人工智能技術爆發初期,我國在中文信息處理、生物特征識別、機器翻譯、智能處理器、自動駕駛和智能機器人等技術方向上緊跟世界前沿,實現了部分人工智能關鍵技術突破。麻省理工學院第十七任校長拉斐爾•萊夫評價認為,中國在人臉識別和語音識別等人工智能領域居世界領先地位。
主要包含了以下階段性成果:中國科學院研發推出全球首款商用深度學習專用處理器“寒武紀”芯片,在運行主流智能算法時性能功耗效率大幅超越中央處理器(CPU)和圖形處理器(GPU);商湯科技的圖像識別技術、科大訊飛的語音識別與合成技術和語言翻譯技術的產業化水平目前處于世界前列,受到國際認可。
在計算機視覺方面也取得重大原始創新。北京大學改寫了持續近兩個世紀的曝光成像原理,發明了脈沖攝影原理,用比特序列逼近高速光電子流,研制出超高速視覺芯片和相機,實現了超高速、高動態、無模糊連續清晰成像。它建立了脈沖視覺算法體系并研制出超高速系統,采用常規光電器件和芯片工藝實現高超聲速過程連續清晰成像和實時跟蹤識別,其專利獲中美歐日韓授權,有望從源頭重塑計算機視覺技術和產業體系。
在人工智能基礎軟硬件方面,華為發布了基于達芬奇架構的昇騰910和昇騰310兩款人工智能芯片,力爭打造以芯片為載體、從底層算法到應用開發的完整生態,為全球開發者和企業提供新的選擇,也為我國企業提供了安全保障。在此基礎上,鵬城實驗室推出了“鵬城云腦Ⅱ”和正在研制“鵬城云腦”下一代設施。“鵬城云腦Ⅱ”是基于華為國產人工智能芯片打造的、作為國內首個全面自主可控的E級智能算力平臺,具有國際領先的人工智能算力水平,已經在多個國際榜單上取得冠軍。該平臺約70%的機時對外開放共享,已支撐近千個國產人工智能模型訓練任務與人工智能算法發布,成為我國最重要的開放共享、自主可控的人工智能大模型訓練平臺之一。
三是人工智能加速與千行百業融合發展。
智能制造方面,正在大力推進智能制造工廠建設,已實現產品個性化定制;
智能醫療方面,已研發人工智能醫學影像產品,可用于篩查早期食管癌,其檢出率高于醫生借助內窺鏡平均檢出率;
智慧城市方面,“城市大腦”已應用于杭州城市交通管理,可有效減少區域通行時間;
智能物流方面,人工智能技術被應用于改進物流系統,分揀效率超過人工分揀的10倍多;
智能交通方面,首都機場采用人工智能技術實現在50秒內完成1700架次航班的停機位安排,降低了飛機延誤率,停機位利用率提高10%;
智能安防方面,廣州利用人臉識別技術幫助發現及抓獲犯罪嫌疑人。
四是人工智能發展的創新生態初步構建。
科技部在自動駕駛、城市大腦、智能醫療、智能語音、智能視覺等領域已構建起國家級開放創新平臺,助力中小企業科技創新,推動行業技術進步和產業升級。比如,某智能語音平臺開發者團隊數量超過80萬家,已形成了覆蓋技術研發、基礎平臺、物聯網、智能硬件等完整人工智能產業鏈。同時,人工智能領域的眾創空間、孵化器、加速器快速發展,創業孵化體系逐步完善。
(二)中美引領大模型發展,我國語言大模型與美國差距正在逐步縮小,視覺、多模態、具身等新一代大模型有望實現齊頭并進
目前,國際大模型領域已形成美國引領、中國緊跟的格局。根據中國科學技術信息研究所2023年5月發布的《中國人工智能大模型地圖研究報告》,從全球已發布的大模型分布來看,中國和美國大幅領先,超過全球總數的80%,中國在大模型數量方面位居全球第二。
中國大模型研發呈現蓬勃發展態勢。截至2023年5月,已發布79個大模型,大部分為語言大模型。
國際上的基礎大模型主要分為語言、視覺、多模態等主要類別。其中,在語言大模型方面,OpenAI的GPT系列和谷歌PaLM 2等已形成領先優勢,我國已研發出智源“悟道•天鷹”、百度“文心”、華為“盤古”、“鵬城•腦海”、阿里通義等語言大模型,但與海外頂尖水平仍有一定差距。隨著人工智能模型開源生態的繁榮,中美大模型的差距將逐步縮小。
在視覺和多模態大模型方面,我國有望扭轉跟隨局面,實現中美齊頭并進。
視覺大模型上,智源研究院創新研發路徑,首創“上下文圖像學習”“以視覺為中心”作為核心建模思想,用圖像理解、解釋、輸出圖像,研發出視覺通用多任務模型Painter,對Painter模型針對物體分割任務作出優化后,研發出國際首個利用視覺提示完成任意分割任務的通用視覺模型SegGPT,已成為與Meta發布的基礎圖像分割模型SAM齊名的國際視覺大模型關鍵里程碑成果。
多模態大模型上,智源研究院研發出首個打通多模態輸入到多模態輸出的統一多模態預訓練模型Emu,超越了此前DeepMind的多模態大模型Flamingo,刷新8項性能指標,并且模型能力覆蓋圖像與文本的生成及視頻理解,能完成任意圖生文和文生圖的多模態任務。中國科學院自動化所研發出的三模態(圖文音)大模型“紫東太初”目前已具有全模態能力,達到國際先進水平。
(三)我國人工智能整體發展已進入全球第一梯隊
美國智庫信息技術與創新基金會(ITIF) 2019年發布《誰在人工智能競賽中獲勝:中國、歐盟還是美國?》報告,從人才、研究、企業發展、應用、數據、硬件6個維度,系統地對比中美歐人工智能技術創新與生態構建能力。2021年1月,ITIF發布該報告的2021年更新版本,指出美國仍然保持著巨大的總體領先優勢,但中國得分相比于2019年有明顯增長,總排名反超歐盟上升至第二位,僅次于美國。我國的應用場景豐富,相比國外有一定優勢。但是,報告也顯示,中國在人工智能研究、人才、企業發展等方面與美國相比差距明顯。
根據英國媒體機構Tortoise Media發布的2023年全球人工智能指數排名,目前人工智能領域綜合情況全球排名前三的國家分別是美國、中國和新加坡。其中,中國在運營環境和政府戰略方面領先于美國,在基礎設施、科研、發展、商業方面緊隨其后,但在人才方面與美國差距較大。
(四)我國人工智能發展的優勢條件
目前,我國在人工智能技術上持續深耕、快速積累,在政策、數據和市場應用上具有一定優勢。
一是強有力的戰略引領和政策支持。2017年《新一代人工智能發展規劃》的發布,開啟了我國人工智能發展的系統部署。該規劃發布后,各部門和地方積極推動落實,國家發改委、教育部、科技部、工信部等部門相繼出臺多項舉措,北京、上海、天津、重慶、廣東等近20個省市出臺了人工智能規劃和行動計劃,紛紛加大研發投入,設立研發機構,制定人才引進、財稅優惠等配套政策,帶動企業加快智能化步伐,產學研協同推進人工智能發展的格局初步形成。
二是海量的數據資源提供支撐。我國互聯網數據資源快速增長,截至2022年底,網民規模超10.6億,我國移動電話用戶規模為16.83億戶,其中5G移動電話用戶達5.61億戶。網民使用網絡購物的比例超過55%,手機支付用戶規模達到5.27億人。特定應用領域數據規模龐大,醫療門診總量每年達到81.8億人次,每年有3億人次做計算機斷層掃描(CT),10億人次做數字化成像(DR);公共和私人領域裝有1.76億個監控攝像頭;年度快遞業務量超過400億件;每年國內旅游人數超過50億人次。
三是豐富的應用需求孵化應用場景。我國具有全球規模最大、較為成熟的互聯網市場,人工智能在互聯網領域的應用空間廣闊。我國作為全球制造業大國,各細分領域都面臨轉型升級,對人工智能應用具有巨大需求。我國新型城鎮化加速推進,城鎮規模不斷擴大,利用人工智能改進城市基礎設施、提升城市治理水平潛力巨大。同時,我國老齡化問題日益突出,居民收入水平不斷提升,消費結構加快升級,對醫療、教育、養老等智能化產品和服務需求迫切。
四是具有潛力的青年人才快速成長聚集。我國加大對人工智能人才培育。2018年,國家自然科學基金委新設人工智能一級學科代碼F06,加大對人工智能基礎研究的支持;國務院學位辦2022年底新設智能科學與技術一級學科,全國各大高校加快布局人工智能學院,擴大本科和研究生培養規模。我國人工智能學者數量大幅增加。
(五)我國人工智能發展的薄弱環節
一是人工智能基礎理論和原創算法差距較大。
我國人工智能研究起步晚,原創性貢獻不多。近年來,隨著各國加快人工智能理論創新探索,模型和方法不斷有新的突破,包括深度學習模型、生成對抗網絡等重大成果和原創性理論貢獻仍以西方國家為主。大模型構建、訓練、調優對齊、推理部署等多個流程使用的主要算法及核心技術大部分來自美國。我國在人工智能領域內高影響力論文數量增長明顯,但是,頂級論文和重大理論創新還主要源自美國、英國、加拿大等。
二是在高端芯片、關鍵部件、高精度傳感器等方面基礎薄弱。
在圖形處理器(GPU)、專用集成電路(ASIC)和現場可編程門陣列(FPGA)等人工智能芯片方面,英偉達、英特爾、高通、超威等歐美國家企業占據壟斷地位。英偉達在GPU領域占據了全球近84%的市場份額,賽靈思(Xilinx)和阿爾特拉(Altera)占據了FPGA市場將近61.9%的份額。美國波士頓動力公司的人形機器人產品(Atlas)依靠其在高精度傳感器和運動控制算法上的巨大優勢,目前已連續完成臺階跳躍、后空翻、單腿三級跳等高難度動作,在智能感知和智能行為融合上達到新的高度。
三是尚未形成具有國際影響力的人工智能開源開放平臺。
當前,國際巨頭企業紛紛建立人工智能開放平臺,打通硬件—系統—產業鏈條,主導建設創新生態。我國在面向特定應用領域已經陸續建立了國家級人工智能開放平臺,但在機器學習等通用開源算法平臺方面布局不夠,且對產業鏈的帶動性不足,國際影響力不夠。
四是數據量大質低,缺乏高質量大規模中文數據集。
在當前深度學習階段,數據對人工智能發展至關重要,特別是在大模型時代,數據對大模型智能水平的影響差不多要超過60%。我國的數據資源極其豐富,但是數據的量大質低,很多不能用于模型訓練。
另外,書籍期刊等版權數據、互聯網平臺數據等高質量數據割裂、封閉、不易獲取,導致我國可用于大模型訓練的高質量中文數據集相對缺乏。
目前,我國大模型訓練主要依賴國際開源數據集,國際數據集中的中文內容少且不規范,Common Crawl中的中文數據不足5%,基于這些數據集訓練的大模型自然是“英文思維”。
建設高質量大規模中文數據集,是我國通用人工智能發展的基本前提。國內已有部分機構開展了相關工作。
五是算力資源短缺。
大模型的快速發展和持續迭代對算力的需求呈爆炸性增長,由于GPU等芯片的供給增長緩慢,導致全球范圍內的算力短缺問題普遍存在,我國的算力短缺問題尤為突出。目前,我國大模型研發所需的算力資源主要來源于智算中心、超算中心和云計算中心。其中,智算中心普遍算力規模不高。
目前我國有超過30個城市正在建設或提出建設智算中心,算力規模目標大部分在1000P左右。超算中心中國產人工智能芯片數量較多,但由于很多是早年部署,型號早、性能低,難以用于大模型訓練。云計算中心的商業任務占用率較高,千億級模型的私有化部署成本接近每年2000萬—3000萬元,成本較高。
六是高水平人才不足。
根據清華大學AMiner AI 2000全球最具影響力人工智能學者榜單,在全球人工智能高影響力學者中,美國人數最多,近3年均穩步在1100人以上,占比約六成;中國位列第二,數量穩步增加,超過了230人,占比一成多,但與美國的差距并沒有縮小,美國是中國的近5倍。
從以上幾點來看,我國發展人工智能既有很好的基礎和優勢,也面臨巨大挑戰,需要探索一條適合我國國情的發展道路。
應堅持科技引領、應用驅動的戰略導向,以促進人工智能與經濟社會深度融合為主線,以提升科技創新能力為主攻方向,全面推動人工智能應用。
應通過科技引領和應用驅動的雙向發力,實現我國人工智能在理論上盡快補上短板、技術上自主可控、產業上占領制高點,全面增強經濟創新力和國際競爭力。
三、全面推進中國人工智能高質量發展——勇毅前行
2023年4月28日召開的中共中央政治局會議指出,要重視通用人工智能發展,營造創新生態,重視防范風險。
我國人工智能發展要深刻把握國際通用人工智能技術發展趨勢,開展前瞻性技術研究,著力實現彎道超車。
同時,要加強政策、人才、底層基礎軟硬件、開源開放等生態環境的打造,營造良好環境。
另外,要加強風險研判,積極推進人工智能治理,推動我國新一代人工智能持續健康發展。
(一)持續完善我國人工智能規劃和政策體系
面對國際通用人工智能發展新形勢、新機遇、新問題、新挑戰,圍繞《新一代人工智能發展規劃》提出的我國到2030年實現人工智能達到世界領先水平的戰略目標,《新一代人工智能發展規劃》在新時期實施時應突出新變化,形成新的規劃任務方向。另外,要針對我國通用人工智能發展的薄弱環節和發展需求,在技術研究、資源開放、場景建設、人才發展等方面制定相關支持政策,打造人工智能高質量發展的支撐政策體系。
(二)加強通用人工智能基礎理論研究和關鍵技術研發
前瞻布局通用人工智能前沿技術研究,開展大模型基礎原理和新架構探索,視覺、視頻、多模態、具身等下一代大模型研究,利用大模型解決重大科學問題,形成具有國際影響力的通用人工智能原創理論體系。
引領通用人工智能關鍵核心技術創新,重點突破分布式高效深度學習框架、大規模認知與推理、可控內容生成、高效低成本訓練與推理等關鍵算法研發,建立我國通用人工智能技術創新體系。
(三)夯實人工智能基礎軟硬件生態底層基礎
推動國產人工智能芯片實現突破,面向通用人工智能技術發展需求,能夠全面支撐大模型訓練、多模態處理、科學計算等場景算力需求,并探索可重構、存算一體、超規格高算力智能芯片等新型架構芯片,提供支撐我國人工智能發展的算力保障。
加強自主開源深度學習框架研發攻關,在大模型分布式訓練和多端多平臺推理部署等方面提升核心能力,研發模型開發、訓練、壓縮、推理全流程工具。
支持人工智能芯片和深度學習框架開展廣泛適配和融合優化,打造人工智能國產基礎軟硬件深度協同生態。
(四)加強數據、算力等資源的匯聚及共享
建立多層次數據開放體系。
相關政府部門出臺政策措施,推動出版社、雜志社、圖書館、博物館、檔案館等版權數據或公共數據機構,以及互聯網平臺對外有序開放數據用于人工智能技術研發,打破數據壁壘。
建立我國大規模高質量中文數據集建設的長效機制,整合匯聚大型互聯網企業、大模型研發企業、數據服務企業、大型出版社、圖書館、主流媒體、行業組織等機構,建設大規模高質量的語言、語音、圖像、視頻和多模態數據集,以及醫療、交通等行業數據集,為我國通用人工智能長期健康發展提供基礎保障。
夯實算力基礎設施建設。
加強智算中心建設,逐步提高算力設施國產化率,為大模型研究提供高性能計算資源和服務。推動中國算力網建設,實現國家級超算中心、智算中心、“東數西算”數據中心的互聯互通,實現全國大型算力的協同調度和高效計算,推動云、網、算等資源融為一體,形成支撐數字經濟發展的國家級算力基礎設施和統一算力大市場,為人工智能技術創新和產業智能化轉型提供普惠算力。
(五)加強人工智能風險預判和治理體系建設
我國在通用人工智能監管上走在國際前列,2023年7月出臺了全球首部生成式人工智能規范性政策文件《生成式人工智能服務管理暫行辦法》,為其他國家相關政策的制定提供了借鑒。伴隨通用人工智能技術的快速發展,我國應堅持發展和安全并重的原則,建立并完善符合我國人工智能發展需求的治理體系。
一是加強對人工通用智能(AGI)發展安全風險的研判,根據風險問題適時調整我國通用人工智能發展策略。
二是建立中國特色的敏捷治理體系。通用人工智能發展迅速,新應用新模式層出不窮,應建立符合我國經濟、社會發展特色的敏捷治理體系,保持政策靈活性,留足制度發展空間,以保障技術的長遠健康發展。
三是開展風險防范技術研究,以技術監管技術,針對大模型基礎原理、安全與價值觀對齊、人工通用智能(AGI)風險控制策略等方面開展深入研究,促進人工智能技術造福于人類。
推動建立健全的人工智能監管方面相關的法律、法規和標準,是保障人工智能高水平提升、高質量發展的重要一環,應逐步完善人工智能的安全保障和倫理規范,保障人工智能的安全和可信度。
一是制定和完善人工智能相關法律、法規和標準,涉及人工智能開發、使用、應用等各個環節,明確相關責任和法律后果,規范人工智能的發展和使用。
二是加強人工智能的安全保障,強化人工智能的安全性研究和技術保障,防范人工智能被惡意利用和攻擊,確保人工智能系統的穩定運行和數據的安全。
三是建立人工智能的倫理規范,明確人工智能的道德責任和社會責任,避免人工智能帶來的負面影響和倫理風險。
四是建立健全人工智能的監管機制,包括人工智能評估、審查、監督、監測等各個環節,加強對人工智能的監管和治理,保障人工智能的安全和可信度。
五是加強人工智能的公眾參與,包括社會組織、專家學者、公民等各方面的參與,加強社會監督和民主監督,推動人工智能的良性發展。
(六)強化人工智能在服務企業升級中發揮更大作用
人工智能作為一項滲透性極強的顛覆性技術,對實體經濟及社會生活的方方面面都具有極其重要的意義,是建設現代化經濟體系、實現高質量發展的重要支撐。企業作為社會經濟活動的基本單位,直面市場、服務市場,是最活躍的創新力量。要實現傳統產業改造,新興產業不斷壯大,現代化產業體系加快形成,就要打好一套“組合拳”。
一是龍頭企業要發揮引領作用,打造開放、協同、共享的創新生態系統,特別是構建一個包括從基礎研究到應用推廣的全鏈式人工智能創新生態系統,助推傳統企業向智能化高端化轉型。
二是加大對人工智能產業的支持和投入,通過設立人工智能創新基金、支持人工智能企業上市等方式,增強該類專精特新“小巨人”利用金融力量為企業不斷造血。
三是搭建人工智能開放創新平臺,通過平臺資源和技術賦能服務企業、高校和研究院所,加速人工智能技術的研發和應用,不斷提高技術創新能力。
四是積極引導推動數據的開放和共享,促進各個領域之間的數據融合和互通,形成全社會共建共享的數據資源庫,切實推進人工智能與實體經濟深度融合。
(七)加強人工智能教育和人才培養
我國的人工智能發展,關鍵在人。培養具有創新能力和實踐能力的高素質人才非常關鍵,可通過設立人工智能專業、加強人工智能相關領域的教育和培訓、支持高水平人才引進等,逐步構建人工智能人才培養體系和課程體系,提高我國人工智能人才隊伍的整體素質。
同時,政府還應積極鼓勵企業和高校合作,加強人工智能人才培養的實踐環節,推動理論與實踐的深度融合。此外,應量身定制包括稅收優惠、研發經費支持、人才獎勵、高層次人才計劃等一系列政策措施,鼓勵創新創業,加強對人工智能領域人才的引進和扶持,從而為人工智能人才的培養和發展提供有力支持。
(八)加強人工智能國際交流與合作
總體來說,應積極參與全球人工智能領域的標準制定和技術交流,加強與國際頂尖人工智能企業和機構的合作,推動人工智能技術的全球創新和發展。
通過加強國際合作機制建設,建立人工智能領域的跨國合作框架,促進全球人工智能技術的開放和共享。
加強人工智能領域的知識產權保護,建立國際人工智能技術標準和知識產權保護機制,促進人工智能技術的國際化應用和交流。
積極參與國際人工智能標準制定,推動人工智能標準化國際化進程,提高我國在國際標準制定中的話語權和地位。
加強國際人才交流與合作,鼓勵優秀人工智能人才到國外交流和學習,引進國際優秀人才來我國工作和合作。
與國際頂尖人工智能企業和機構建立戰略合作伙伴關系,共同開展技術研發、應用推廣、人才培養等領域的合作,加速形成具有國際競爭力的人工智能產業集群。
參與國際人工智能賽事和競賽,提高我國人工智能技術的國際影響力和競爭力。
(原始文字來源:《黨委中心組學習》)
【作者系中國工程院院士;來源:朱批藍批微信號】
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學習參考;
2、本站屬于非營利性網站,如涉及版權和名譽問題,請及時與本站聯系,我們將及時做相應處理;
3、歡迎各位網友光臨閱覽,文明上網,依法守規,IP可查。
作者 相關信息
? 昆侖專題 ?
? 高端精神 ?
? 新征程 新任務 新前景 ?
? 習近平治國理政 理論與實踐 ?
? 國策建言 ?
? 國資國企改革 ?
? 雄安新區建設 ?
? 黨要管黨 從嚴治黨 ?