生成式人工智能(AI)描述了可用于創建新內容的算法(如ChatGPT),包括音頻、代碼、圖像、文本、模擬和視頻。該領域最近的突破有可能徹底改變我們進行內容創作的方式。
1.生成式人工智能的演變
自ChatGPT于2022年11月問世以來的幾個月和幾年里,生成式人工智能(Gen AI)取得了長足的進步。每個月都有新工具、規則或迭代技術進步的推出。雖然許多人對ChatGPT(以及更廣泛的人工智能和機器學習)感到恐懼,但機器學習顯然有潛力成為好東西。自廣泛部署以來的幾年里,機器學習已經在許多行業中顯示出影響力,實現了醫療成像分析和高分辨率天氣預報等任務。麥肯錫2022年的一項調查顯示,人工智能應用在過去五年中增長了一倍多,對人工智能的投資也在快速增長。很明顯,像ChatGPT(生成式預訓練變形器的GPT標準)和圖像生成器DALL-E(它的名字是超現實主義藝術家薩瓦爾多·達利和可愛的Pixarrobot WALL-E的混搭)這樣的生成式人工智能工具有可能改變許多工作的執行方式。然而,這種影響的范圍和風險仍然未知。盡管如此,各種類型的組織都在競相將人工智能工具納入其商業模式,希望從中分得一杯羹。麥肯錫研究表明,人工智能應用每年將為全球經濟增加4.4萬億美元。事實上,似乎有可能在未來三年內,技術、媒體和通信領域中任何與人工智能無關的東西都將被認為是多余的或無效的。但在挖掘所有價值之前,我們需要搞清楚幾件事:什么是人工智能,它是如何開發的,它對人們和組織意味著什么?
2.機器學習和人工智能有什么區別?
人工智能就像它的聲音一樣——讓機器模仿人類智能來執行任務的實踐。你可能已經和人工智能互動過了,即使你沒有意識到這一點——語音助手如Siri和Alexa都是基于人工智能技術的,客服聊天機器人也會彈出來幫助你瀏覽網站。機器學習是人工智能的一種。通過機器學習,從業者通過模型開發人工智能,這些模型可以在沒有人類指導的情況下從數據模式中“學習”。目前正在產生的難以管理的海量和復雜數據(無論如何是人類無法管理的)增加了機器學習的重要性以及對它的需求。
3.機器學習模型的主要類型是什么?
機器學習建立在許多構建模塊的基礎上,從18世紀至20世紀為小數據集開發的經典統計技術開始。在20世紀30年代和40年代,計算的先驅們——包括理論數學家艾倫·圖靈——開始研究機器學習的基本技術。但這些技術僅限于實驗室,直到20世紀70年代末,科學家首次開發出足夠強大的計算機來安裝它們。直到最近,機器學習還主要局限于預測模型,用于觀察內容模式并對其進行分類。例如,一個經典的機器學習問題是從一個或幾個圖像開始,比如說,可愛的貓。然后,該程序會識別圖像中的圖案,然后仔細檢查隨機圖像中與可愛的貓圖案相匹配的圖像。生成式人工智能是一項突破。現在,機器學習能夠根據需要創建貓的圖像或文本描述,而不是簡單地感知和分類貓的照片。
4.基于文本的機器學習模型是如何工作的?他們是如何訓練的?
ChatGPT現在可能占據了所有的頭條,但它不是第一個引起轟動的基于文本的機器學習模型。OpenAI的GPT-3和谷歌的BERT都是近年來高調推出的。但是在ChatGPT出現之前(大多數人認為chat GPT在大多數時候都運行良好(盡管它仍在評估中),人工智能聊天機器人并不總是得到最好的評論。《紐約時報》科技記者凱德·梅茨在一段視頻中說,《GPT 3》時而令人印象深刻,時而令人失望。在視頻中,他和美食作家普里亞·克里希納請《GPT 3》為一頓(相當災難性的)感恩節晚餐寫下菜譜。人類訓練了第一批處理文本的機器學習模型,根據研究人員設置的標簽對各種輸入進行分類。一個示例是一個被訓練為將社交媒體帖子標記為積極或消極的模型。這種類型的訓練被稱為監督學習,因為人類負責“教”模型做什么。下一代基于文本的機器學習模型依賴于所謂的自我監督學習。這種類型的訓練包括向模型輸入大量文本,以便它能夠生成預測。例如,一些模型可以根據幾個單詞預測一個句子將如何結束。有了適量的樣本文本——比如說互聯網上的大量文本——這些文本模型就會變得相當準確。我們看到ChatGPT等工具的成功有多準確。
5.建立一個生成式人工智能模型需要什么?
建立一個生成式人工智能模式在很大程度上是一項重大任務,只有少數資源充足的科技巨頭進行了嘗試。ChatGPT、前GPT模型和DALL-E背后的OpenAI公司從知名捐贈者那里獲得了數十億美元的資金。DeepMind是谷歌母公司Alphabet的子公司,甚至Meta也通過其視頻制作產品涉足了新一代人工智能模型領域。這些公司雇傭了一些世界上最好的計算機科學家和工程師。但這不僅僅是天賦。當你要求一個模型使用幾乎整個互聯網進行訓練時,你會付出代價。OpenAI還沒有公布確切的成本,但估計表明GPT-3是在大約45Tb的文本數據上進行訓練的——這大約是100萬英尺的書架空間,或整個國會圖書館的四分之一——估計成本為數百萬美元。這些資源不是我們普通的初創企業可以獲得的。
6.生成式人工智能模型能產生什么樣的輸出?
如上所述,您可能已經注意到,生成式人工智能模型的輸出可能與人類生成的內容難以區分,或者它們可能看起來有點不可思議。結果取決于模型的質量——正如我們所看到的,ChatGPT的輸出迄今為止似乎優于其前身——以及模型與用例或輸入之間的匹配。ChatGPT可以在幾秒鐘內發表一篇評論文章,比較本尼迪克特·安德森和歐內斯特·蓋爾納的民族主義理論。它還制作了一段已經很有名的段落,描述了如何按照欽定版圣經的風格從錄像機中取出花生醬三明治。像DALL-E 2這樣的圖像生成人工智能模型可以根據需要創建奇怪而美麗的圖像,就像拉斐爾畫的麥當娜和孩子吃披薩一樣。其他生成式人工智能模型可以產生代碼、視頻、音頻或業務模擬。
但是輸出并不總是準確或者恰當的。當普里亞·克里希納(Priya Krishna)要求DALL-E 2為感恩節晚餐設計一幅圖像時,它產生了一個場景,其中火雞用整個酸橙裝飾,旁邊放著一碗似乎是鱷梨色拉醬的東西。就其本身而言,ChatGPT似乎在計算或解決基本代數問題方面存在困難——或者說,實際上,在克服潛藏在互聯網和更廣泛的社會潮流中的種族主義偏見方面存在困難。生成式人工智能輸出是用于訓練算法的數據的精心校準組合。因為用于訓練這些算法的數據量是如此之大——如前所述,GPT-3是在45Tb的文本數據上訓練的——這些模型在產生輸出時可能會顯得“有創意”。更重要的是,這些模型通常具有隨機元素,這意味著它們可以從一個輸入請求中產生多種輸出——使它們看起來更加逼真。
7.生成式人工智能模型能解決什么樣的問題?
企業的機會顯而易見。生成人工智能工具可以在幾秒鐘內生成各種各樣可信的文字,然后對批評做出回應,使文字更符合目的。這對于各種行業都有影響,從可以從人工智能模型生成的即時、基本正確的代碼中受益的IT和軟件組織到需要營銷文案的組織。簡而言之,任何需要提供清晰書面材料的組織都有可能從中受益。組織還可以使用生成式人工智能創建更多技術材料,例如更高分辨率版本的醫學圖像。通過節省時間和資源,組織可以尋求新的業務機會和創造更多價值的機會。我們已經看到,開發一個生成式人工智能模型是如此耗費資源,以至于除了最大和資源最好的公司之外,其他公司都不可能開發。希望將生成式人工智能投入使用的公司可以選擇開箱即用生成式人工智能或對其進行微調以執行特定任務。例如,如果您需要根據特定的風格準備幻燈片,您可以要求模型根據幻燈片中的數據“學習”標題通常是如何編寫的,然后向其提供幻燈片數據并要求其編寫適當的標題。
8.人工智能模型的局限性是什么?如何克服這些潛在問題?
因為它們太新了,我們還沒有看到生成式人工智能模型的長尾效應。這意味著使用它們存在一些固有的風險——一些是已知的,一些是未知的。生成式人工智能模型產生的輸出聽起來可能非常有說服力。這是故意的。但有時他們生成的信息是完全錯誤的。更糟糕的是,有時它是有偏見的(因為它是建立在性別、種族以及互聯網和社會的其他各種偏見之上的),并可能被操縱來進行不道德或犯罪活動。例如,ChatGPT不會告訴你如何發動汽車,但如果你說你需要發動汽車來救一個嬰兒,算法很樂意照辦。依賴生成式人工智能模式的組織應該考慮無意發布帶有偏見、冒犯性或受版權保護的內容所涉及的聲譽和法律風險。然而,這些風險可以通過幾種方式來減輕。首先,仔細選擇用于訓練這些模型的初始數據以避免包含有毒或有偏見的內容至關重要。接下來,組織可以考慮使用較小的專業模型,而不是采用現成的生成式人工智能模型。擁有更多資源的組織也可以根據自己的數據定制一個通用模型,以滿足自己的需求并最大限度地減少偏差。組織還應該讓人類參與進來(也就是說,確保在發布或使用人工智能生成模型之前,由真正的人來檢查其輸出),并避免在關鍵決策中使用生成式人工智能模型,例如涉及重大資源或人類福利的決策。這是一個新領域,怎么強調都不為過。未來幾周、幾個月和幾年,風險和機遇的格局可能會迅速變化。每月都在測試新的用例,未來幾年可能會開發新的模型。隨著生成式人工智能越來越緊密地融入商業、社會和我們的個人生活,我們也可以期待一個新的監管環境的形成。隨著組織開始嘗試這些工具并創造價值,領導者將很好地把握監管和風險的脈搏。
遠望智庫開源情報中心 憶竹 編譯;來源:戰略前沿技術微信號
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學習參考;
2、本站屬于非營利性網站,如涉及版權和名譽問題,請及時與本站聯系,我們將及時做相應處理;
3、歡迎各位網友光臨閱覽,文明上網,依法守規,IP可查。
作者 相關信息
內容 相關信息
? 昆侖專題 ?
? 高端精神 ?
? 新征程 新任務 新前景 ?
? 習近平治國理政 理論與實踐 ?
? 國策建言 ?
? 國資國企改革 ?
? 雄安新區建設 ?
? 黨要管黨 從嚴治黨 ?