8月1日,中國科學(xué)院院士、清華大學(xué)人工智能研究院名譽院長張鈸在ISC.AI 2024第十二屆互聯(lián)網(wǎng)安全大會的演講上表示,當(dāng)前人工智能還沒有理論,只能發(fā)展出來針對的模型和算法,它們都是針對特定領(lǐng)域的,軟件或硬件也都是專用的,市場很小,因此到現(xiàn)在為止還沒有發(fā)展出一個大型的人工智能產(chǎn)業(yè),問題就出在這里。
而在7月19日清華五道口“金融PLUS系列產(chǎn)業(yè)峰會2024”上,他以“第三代人工智能與具身智能”為題在演講中表示,在信息科技時代,中國的使命是追趕,而在人工智能時代,中國有機(jī)會做引領(lǐng)者。
張鈸現(xiàn)年89歲高齡,過去幾十年,他在清華大學(xué)培養(yǎng)了一批人工智能人才,是中國人工智能學(xué)科的奠基人之一。當(dāng)前不少火熱的“清華系”大模型企業(yè)如生數(shù)科技、智譜AI、面壁智能、Kimi等,均受益于在清華打下的技術(shù)基礎(chǔ),核心技術(shù)人才或直接或間接師承于張鈸。
三大能力與一大缺陷
大模型應(yīng)用呈現(xiàn)“U”字形,對錯誤容忍度要高
在張鈸看來,因為理論的限制,人工智能產(chǎn)業(yè)的前一階段必須要結(jié)合具體的應(yīng)用領(lǐng)域來發(fā)展,因此這一階段發(fā)展出的人工智能屬于專用人工智能,即“弱”人工智能。不過,他也指出,目前基礎(chǔ)模型在語言問題上做到了通用,“我們考慮基礎(chǔ)模型的時候需要考慮三大能力與一大缺陷,這點是非常重要,是我們考慮今后產(chǎn)業(yè)發(fā)展的出發(fā)點。”
他解釋稱,大語言模型的強(qiáng)大之處體現(xiàn)在強(qiáng)大的語言生成能力、強(qiáng)大的人機(jī)自然交互能力和強(qiáng)大的舉一反三能力,“大語言模型的語言生成屬于開放領(lǐng)域,能夠生成多樣化的結(jié)果,所有輸出人類都可以理解,即便是‘胡說八道’我們也可以理解在胡說什么,這一點非常重要。人類跟機(jī)器在開放領(lǐng)域進(jìn)行自然語言對話,我們之前以為要通過幾代人的努力才能達(dá)到這個目標(biāo),但大家沒想到的是2020年這個目標(biāo)已經(jīng)達(dá)到了。”從人工智能三要素走向四要素之路,院士張鈸清華演講全文
張鈸表示,大模型的缺陷就是“幻覺”,“因為我們要求它有多樣性的輸出,必然它會產(chǎn)生錯誤。這個錯誤跟機(jī)器都會產(chǎn)生錯誤非常不一樣,機(jī)器產(chǎn)生的錯誤往往是我們可以控制的,這個錯誤是本身的錯誤,是一定會發(fā)生的,而且我們不可控,所以,這點也是我們后面考慮它應(yīng)用需要考慮的問題。”
張鈸重點分析了幻覺出現(xiàn)的根本原因,他認(rèn)為模型的根本限制在于目前所有的機(jī)器所做的工作都是外部驅(qū)動,人類教它怎么做,而不是自己主動做。同時,它生成的結(jié)果受提示詞的影響非常大,與人類是在內(nèi)部意圖的控制下完成工作有明顯的區(qū)別。
結(jié)合三大能力與一大缺陷,張鈸總結(jié)出了大模型當(dāng)前適合應(yīng)用的場景:對錯誤的容忍程度要高。他表示從產(chǎn)業(yè)情況來看,大模型的應(yīng)用呈現(xiàn)“U”字形——前部的規(guī)劃、設(shè)計要求內(nèi)容多樣性,后部的服務(wù)、推薦也要求多樣性,同時對錯誤的容忍程度較高,但中間部分就需要根據(jù)情況來考慮使用。
盡管存在問題,張鈸還是表示不論怎樣“模型是一定要用的”,“因為有了模型底座以后,應(yīng)用的效率和質(zhì)量一定會提高。過去的應(yīng)用場景我們是在空的計算機(jī)上開發(fā)軟件提供服務(wù),空的計算機(jī)相當(dāng)于文盲,而現(xiàn)在有了大模型,平臺至少是個高中生,開發(fā)效率一定會提高,以后的方向一定是這樣。”
大模型有四大發(fā)展方向
如何發(fā)展通用人工智能,將來不止限于人形機(jī)器人
張鈸介紹,未來大模型有四個發(fā)展方向,對如何改進(jìn)大模型非常重要。
其一是與人類對齊,“大模型沒有判斷對錯的能力,自己不能自我更新,都是人類驅(qū)動下去更新的,不突破這一點,機(jī)器就不能自我進(jìn)化。大模型需要外部的提示,所以在人類的驅(qū)動下改正大模型的錯誤是我們做的第一件工作。”
其二是多模態(tài)生成,“多模態(tài)生成將來對產(chǎn)業(yè)的發(fā)展非常重要,因為大家看到大模型主要是生成文本,但是我們用同樣的辦法生成圖像、聲音、視頻、代碼之后,生成的水平是跟人類的水平接近的。我們現(xiàn)在為什么圖像能生成的那么好,主要是把圖像跟文本掛鉤。所以,最本質(zhì)的是文本處理的突破。”
其三是AI Agent(智能體)的概念,“要把大模型和周圍的虛擬環(huán)境結(jié)合起來,讓環(huán)境提示它的錯誤,因為一件事做了之后才知道對和錯,因此智能體的概念非常重要,讓環(huán)境提示智能體,讓它有反思的機(jī)會,去改正錯誤。”
其四是具身智能,“通過加上機(jī)器人,讓大模型在物理世界也能夠工作。將來如何發(fā)展通用機(jī)器人?我認(rèn)為要‘軟件通用,硬件多樣化’,馬斯克宣傳人形機(jī)器人,但我認(rèn)為將來不止限于人形機(jī)器人。”
發(fā)展大模型要解決理論問題
在此前“智譜AI”2024年度技術(shù)開放日上,張鈸在《從大語言模型到通用人工智能》的主題分享中表示,以前的人工智能都受限于三個“特定”:特定領(lǐng)域、特定算法、完成特定任務(wù)。人工智能只能在限定的領(lǐng)域內(nèi)工作,受限于特定算法,并完成特定的預(yù)設(shè)任務(wù)。這三個特定都使其受限于某一應(yīng)用領(lǐng)域。
他說,生成式模型完全改變了這種模式。我們使用通用的轉(zhuǎn)換器(Transformer)模型,在開放領(lǐng)域內(nèi)生成各種任務(wù),完成多種任務(wù),不受領(lǐng)域限制。“這表明人工智能正在向第三代人工智能發(fā)展,也證明了行為主義道路是可行的。”
在他看來,第一代人工智能運用了知識、算法、算力三個要素,其中最主要的是知識。第二代人工智能則主要用了數(shù)據(jù)、算法和算力三個要素。為了克服人工智能的固有缺點,第三代人工智能時代,唯一的辦法是把知識、數(shù)據(jù)、算法和算力這四個要素同時運用。
他表示,發(fā)展第三代人工智能,首先必須建立理論,大模型的存在沒有理論可以解釋,這也是到現(xiàn)在為止還沒有發(fā)展出一個大型的人工智能產(chǎn)業(yè)的問題所在。
通用人工智能的終極目標(biāo)是需要實現(xiàn)的
人工智能時代,中國有機(jī)會做引領(lǐng)者
在7月19日清華五道口“金融PLUS系列產(chǎn)業(yè)峰會2024”上,張鈸表示,ChatGPT向通用人工智能邁出了一步,但它只解決了語言問題,除了語言之外還有大量的其他問題,目前的人工智能浪潮只是一個開始。
就人工智能的發(fā)展方向,人類目前正在進(jìn)行第三步工作,用他的話說,就是在大模型的基礎(chǔ)上構(gòu)造一個智能體,使其能夠與數(shù)字世界交互。
張鈸認(rèn)為,通用人工智能的終極目標(biāo)是需要實現(xiàn),第一,與領(lǐng)域無關(guān);第二,與任務(wù)無關(guān),且達(dá)到人類的水平;第三,建立人工智能統(tǒng)一理論。
“在信息科技時代,中國的使命是追趕,而在人工智能時代,中國有機(jī)會做引領(lǐng)者。”他說。
來源:新京報貝殼財經(jīng)、清華大學(xué)人工智能國際治理研究院、光明日報、元界等
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學(xué)習(xí)參考;
2、本站屬于非營利性網(wǎng)站,如涉及版權(quán)和名譽問題,請及時與本站聯(lián)系,我們將及時做相應(yīng)處理;
3、歡迎各位網(wǎng)友光臨閱覽,文明上網(wǎng),依法守規(guī),IP可查。
作者 相關(guān)信息
院士張鈸:大模型應(yīng)用呈現(xiàn)“U”形,中國有機(jī)會
2024-08-02習(xí)近平:干什么就重點學(xué)什么、缺什么就重點補
2024-08-02內(nèi)容 相關(guān)信息
院士張鈸:大模型應(yīng)用呈現(xiàn)“U”形,中國有機(jī)會做AI時代引領(lǐng)者
2024-08-02? 昆侖專題 ?
? 高端精神 ?
? 新征程 新任務(wù) 新前景 ?
? 國策建言 ?
? 國資國企改革 ?
? 雄安新區(qū)建設(shè) ?
? 黨要管黨 從嚴(yán)治黨 ?
? 社會調(diào)查 ?