斯坦福團(tuán)隊(duì)抄襲中國(guó)開(kāi)源大模型,事件曝光后連夜刪庫(kù)跑路。
對(duì)這條新聞,恐怕不少人第一反應(yīng)和科工力量一樣,有種一吐胸中郁悶的感受。此前很長(zhǎng)一段時(shí)間,從美國(guó)朝野鎖死中國(guó)AI研究能力的叫囂,到中文網(wǎng)絡(luò)上對(duì)國(guó)產(chǎn)大模型怪話連篇的調(diào)侃,讓很多人對(duì)中國(guó)AI產(chǎn)業(yè)的發(fā)展倍感焦慮,而通過(guò)這次事件,這樣的焦慮恐怕可以得到相當(dāng)程度的紓解。
經(jīng)過(guò)近兩天的發(fā)酵,這起事件本身毫無(wú)疑問(wèn)已經(jīng)“實(shí)錘”,不僅Llama3-V團(tuán)隊(duì)發(fā)布道歉聲明,作為被抄襲方的面壁智能,也由CEO李大海透露了核查結(jié)果,Llama3-V和MiniCPM-Llama3-V-2.5這兩個(gè)模型即便在高斯擾動(dòng)驗(yàn)證后,在正確和錯(cuò)誤表現(xiàn)方面都高度相似。
兩個(gè)模型的代碼對(duì)比
不過(guò)繼續(xù)挖掘信息的話可以發(fā)現(xiàn),其實(shí)所謂的斯坦福團(tuán)隊(duì)只是兩個(gè)印度裔本科生自己攢的局,闖禍后,他們還第一時(shí)間把鍋甩給了實(shí)際干活的槍手,聲稱(chēng)自己是被阿拉伯裔碼農(nóng)描繪的多模態(tài)架構(gòu)忽悠了,他們實(shí)際只是在社交媒體平臺(tái)幫著后者宣傳推廣。
而扛下了所有的碼農(nóng)“槍手”Mustafa Aljadery,也是個(gè)妙人,根據(jù)其網(wǎng)上簡(jiǎn)歷,目前同時(shí)寫(xiě)了三份全職工作,除了兩個(gè)自己注冊(cè)的小微企業(yè),還包括量化投資大廠Citadel“即將入職的暑期實(shí)習(xí)生”。
總之,這個(gè)“斯坦福團(tuán)隊(duì)”里的臥龍鳳雛,倒是讓人見(jiàn)識(shí)到了美國(guó)科技產(chǎn)業(yè)最底層的一個(gè)微觀切片,相互忽悠攢項(xiàng)目、海投注水論文“抽獎(jiǎng)”、絞勁腦汁包裝履歷,灣區(qū)大學(xué)生的求職“內(nèi)卷”也著實(shí)不容易。
斯坦福的作者在中午做出了最新回應(yīng),但現(xiàn)在這條回應(yīng)已刪除 圖源:網(wǎng)友截圖
Aljadery之所以抄上MiniCPM-Llama3-V-2.5,很可能是因?yàn)檫@個(gè)模型前一段時(shí)間在HuggingFace趨勢(shì)榜上連續(xù)霸榜,性能表現(xiàn)非常亮眼,OpenCompass性能基準(zhǔn)榜單上平均得分65.1,甚至超過(guò)了GPT-4V、Gemini Pro 這些主流商用模型,而開(kāi)發(fā)者在美國(guó)似乎又沒(méi)有什么關(guān)注度,所以他們認(rèn)為抄過(guò)來(lái)交差應(yīng)該沒(méi)什么風(fēng)險(xiǎn)。但這次東窗事發(fā)之后,幾個(gè)年輕人恐怕都會(huì)面臨“偷雞不成蝕把米”的后果。
斯坦福人工智能實(shí)驗(yàn)室主任Christopher Manning發(fā)文譴責(zé)抄襲行為,他認(rèn)為團(tuán)隊(duì)在事發(fā)后避重就輕,并對(duì)MiniCPM 這一中國(guó)開(kāi)源模型表示贊揚(yáng)。
在科工力量看來(lái),這次事件背后,還有著更值得關(guān)注和探討的信息。
自從ChatGPT亮相以來(lái),有關(guān)國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展的討論中,已逐漸形成了所謂的技術(shù)派和市場(chǎng)派分野,前者以入局企業(yè)為代表,往往用“相當(dāng)于GPT-x.x”來(lái)衡量技術(shù)能力,力求追上乃至反超美國(guó)巨頭,而后一派則以PE/VC投資人為代表,認(rèn)為OpenAI等企業(yè)連續(xù)不斷的突破已經(jīng)說(shuō)明,國(guó)內(nèi)沒(méi)有可能也沒(méi)有必要繼續(xù)在基礎(chǔ)大模型上苦苦追趕,應(yīng)該利用開(kāi)源大模型成果,聚焦于挖掘場(chǎng)景應(yīng)用價(jià)值?;谶@樣的認(rèn)識(shí),甚至有人喊出了“不會(huì)投場(chǎng)上任何一家中國(guó)大模型公司”。
在過(guò)去一兩年內(nèi),這樣的爭(zhēng)論或許是各有理?yè)?jù)的,不過(guò)今天的中國(guó)畢竟不同于技工貿(mào)和貿(mào)工技只能二選一的年代了,我們所擁有的基礎(chǔ)和資源,已經(jīng)足以支撐“成年人不做選擇”。
所以我們會(huì)看到,一方面,技術(shù)派的突破在2024年已經(jīng)有加速態(tài)勢(shì),像月之暗面Kimi、幻方DeepSeek這些產(chǎn)品,近期在美國(guó)業(yè)界引發(fā)廣泛關(guān)注;而另一方面,就像這次事件所展現(xiàn)的,國(guó)內(nèi)基于開(kāi)源大模型的派生模型開(kāi)發(fā)水平也越來(lái)越高,像MiniCPM-Llama3-V 2.5是基于SigLip-400M和Llama3–8B-Instruct構(gòu)建,而開(kāi)發(fā)者面壁智能最新發(fā)布的開(kāi)源大模型Eurux-8x22B,則是基于Mixtral-8x22B,號(hào)稱(chēng)早于Llama3、比肩Llama3、推理超越Llama3,刷新開(kāi)源大模型推理性能SOTA。
月之暗面Kimi與幻方DeepSeek的平臺(tái)界面
這些進(jìn)展當(dāng)然令人欣喜,不過(guò)無(wú)論技術(shù)派還是市場(chǎng)派,未來(lái)要走的路還很長(zhǎng)。比如,國(guó)內(nèi)基礎(chǔ)大模型開(kāi)發(fā)者在實(shí)現(xiàn)GPT-4o乃至未來(lái)GPT-5的技術(shù)能力后,如何培育開(kāi)發(fā)工具鏈和應(yīng)用生態(tài),仍將是一大挑戰(zhàn);而對(duì)于聚焦場(chǎng)景與領(lǐng)域應(yīng)用落地的企業(yè),則有必要回答這樣一個(gè)追問(wèn):開(kāi)源大模型是否永遠(yuǎn)是免費(fèi)的午餐?
誠(chéng)然,目前開(kāi)源大模型社區(qū),尚未受到地緣因素的明顯干擾,但即便沒(méi)有人興風(fēng)作浪“拖后腿”,長(zhǎng)期安于使用別人的基礎(chǔ)模型成果,也意味著將制高點(diǎn)拱手讓給他人。
更值得注意的是,在開(kāi)源大模型原始創(chuàng)新上,歐洲、特別是法國(guó)正占據(jù)不容忽視的地位,AI大模型的美中法“三國(guó)殺”格局已隱約可見(jiàn)。
具體來(lái)看,上文提到的Mixtral-8x22B,就來(lái)自于法國(guó)初創(chuàng)企業(yè)Mistral AI;至于Llama系列,盡管名義上是美國(guó)巨頭Meta的產(chǎn)品,但其開(kāi)發(fā)團(tuán)隊(duì)則主要位于法國(guó),相關(guān)人才和知識(shí)自然也主要在法國(guó)流動(dòng)。
在斯坦福大學(xué)編制的《AI指數(shù)報(bào)告2024》中,主要機(jī)器學(xué)習(xí)模型的“原產(chǎn)地”排名上,美、中、歐盟已分別占據(jù)前三排名
可資參照的是,在斯坦福大學(xué)編制的《AI指數(shù)報(bào)告2024》中,主要機(jī)器學(xué)習(xí)模型的“原產(chǎn)地”排名上,美、中、法已分別占據(jù)前三排名;歐盟加英國(guó)合計(jì),更是已超越中國(guó)。
這樣的格局中,蘊(yùn)含著不言自明的威脅性,如果國(guó)內(nèi)AI產(chǎn)業(yè)界繼續(xù)對(duì)開(kāi)源基礎(chǔ)模型秉持“拿來(lái)主義”,長(zhǎng)此以往則可能進(jìn)一步增強(qiáng)歐洲在產(chǎn)業(yè)競(jìng)爭(zhēng)中的主動(dòng)性,畢竟在基礎(chǔ)模型之外,歐洲獲得高端算力的便利性也遠(yuǎn)強(qiáng)于國(guó)內(nèi)。
總體而言,以這一事件為標(biāo)志,隨著中國(guó)AI大模型產(chǎn)業(yè)的迅速成長(zhǎng),其對(duì)美國(guó)產(chǎn)業(yè)生態(tài)的“反作用力”也會(huì)越來(lái)越頻繁而顯著,能否在多邊博弈中穩(wěn)中求進(jìn),離不開(kāi)每一個(gè)產(chǎn)業(yè)人的共同努力。
【文/觀察者網(wǎng)專(zhuān)欄作者 科工力量;來(lái)源:觀察者網(wǎng)】
1、本文只代表作者個(gè)人觀點(diǎn),不代表本站觀點(diǎn),僅供大家學(xué)習(xí)參考;
2、本站屬于非營(yíng)利性網(wǎng)站,如涉及版權(quán)和名譽(yù)問(wèn)題,請(qǐng)及時(shí)與本站聯(lián)系,我們將及時(shí)做相應(yīng)處理;
3、歡迎各位網(wǎng)友光臨閱覽,文明上網(wǎng),依法守規(guī),IP可查。
作者 相關(guān)信息
科工力量:斯坦福AI團(tuán)隊(duì)抄襲中國(guó)大模型?背后還
2024-06-05“航空工業(yè)堅(jiān)決不能成為國(guó)足,要爭(zhēng)取當(dāng)國(guó)乒”
2022-11-09威爾·奈特:拜登面臨重大挑戰(zhàn)?中國(guó)為取得科技
2020-12-21華為中興更改設(shè)計(jì)加速去美國(guó)化,中國(guó)未來(lái)5年
2020-08-22內(nèi)容 相關(guān)信息
科工力量:斯坦福AI團(tuán)隊(duì)抄襲中國(guó)大模型?背后還有更值得關(guān)注的信息
2024-06-05聞韜:羔華瘋了,搞簽名活動(dòng)逼斯坦福大學(xué)開(kāi)除谷愛(ài)凌
2022-02-241.68億!美國(guó)史上最大招生舞弊!涉及SAT、ACT管理層,耶魯、斯坦福等8所名校....
2019-03-16斯坦福大學(xué)華裔科學(xué)家張首晟突然去世! 楊振寧曾評(píng)價(jià)他:拿諾貝爾獎(jiǎng)只是時(shí)間問(wèn)題
2018-12-07? 昆侖專(zhuān)題 ?
? 高端精神 ?
? 新征程 新任務(wù) 新前景 ?
? 國(guó)策建言 ?
? 國(guó)資國(guó)企改革 ?
? 雄安新區(qū)建設(shè) ?
? 黨要管黨 從嚴(yán)治黨 ?
? 社會(huì)調(diào)查 ?