一、“中國(guó)成功進(jìn)行了原子彈試驗(yàn),這是‘自由世界’最黑暗、最富悲劇性的一天”
1964年10月16日,在羅布泊沙漠的深處,在一陣宛如太陽(yáng)般耀眼的閃光過(guò)后,面對(duì)著遠(yuǎn)方緩緩升起的蘑菇云,參與596工程的同志們沸騰了,原本安靜的人群一下子成了歡樂(lè)的海洋。而在太平洋彼岸的美國(guó),當(dāng)中國(guó)原子彈橫空出世的消息傳到白宮的橢圓形辦公室里之后,時(shí)任美國(guó)總統(tǒng)約翰遜卻陷入了沉默,在沉默良久之后,他終于用一種充滿沮喪的口氣,無(wú)可奈何地承認(rèn)了那個(gè)令美帝國(guó)主義者痛苦不已的事實(shí):
“中國(guó)成功進(jìn)行了原子彈試驗(yàn)。這是‘自由世界’最黑暗、最富悲劇性的一天。”
美國(guó)總統(tǒng)林登·約翰遜
時(shí)隔60年以后,大洋彼岸的又有一群美國(guó)人,他們也經(jīng)歷了一次和當(dāng)年約翰遜一樣的至暗時(shí)刻。
當(dāng)?shù)?span lang="EN-US">1月23日,在美國(guó)匿名職場(chǎng)論壇TB(TeamBlind)上,一名Meta公司員工發(fā)布的一篇帖子一石激起千層浪。在這篇題為《Meta的生成式人工智能部門(mén)陷入了恐慌》的文章中,這位Meta公司員工用一種悲哀中又帶著幾分戲謔的語(yǔ)氣如是寫(xiě)道:
“550萬(wàn)美元,你們知道這是個(gè)什么概念嗎?Meta公司的生成式AI部門(mén)里頭有很多所謂的‘領(lǐng)導(dǎo)’,他們之中每一個(gè)人的年薪都超過(guò)了這個(gè)數(shù)字。我們投入了那么多錢(qián)到底都花到哪兒去了?這些享受著高薪厚祿的所謂‘領(lǐng)導(dǎo)’又該怎么去向公司高層解釋他們的存在意義呢?DeepSeek就已經(jīng)足夠可怕了,自它橫空出世以來(lái),我們Mate的工程師都在沒(méi)日沒(méi)夜地瘋狂對(duì)它進(jìn)行拆解研究,并試圖從中抄襲一切我們能夠抄襲的東西,并希望借此復(fù)制出一個(gè)逆向的DeepSeek出來(lái)。可都沒(méi)等我們抄明白上一個(gè)版本呢,中國(guó)人就發(fā)布了他們的最新版本DeepSeek-R1,這下事情變得更糟糕了。當(dāng)對(duì)手的更新頻率已經(jīng)超過(guò)了你的抄襲速度的時(shí)候,你哪怕不是干我們這一行的也應(yīng)該心里有數(shù)了。家人們,還有高手!大的要來(lái)了!”
其實(shí)不光扎克伯格的Meta,我估計(jì)這會(huì)兒山姆·奧爾特曼的OpenAI公司也挺焦慮的。因?yàn)?span lang="EN-US">OpenAI訓(xùn)練出來(lái)的 GPT-4o模型的成本高達(dá)1億美元,這個(gè)數(shù)字幾乎是深度求索訓(xùn)練同類(lèi)模型成本的近20倍。
雖然Mate和OpenAI在AI這塊花了比深度求索多得多的錢(qián),但是最后他們搞出來(lái)的大語(yǔ)言模型卻并沒(méi)有展現(xiàn)出比DeepSeek更強(qiáng)的技術(shù)競(jìng)爭(zhēng)力。毫不夸張地說(shuō),在這場(chǎng)沒(méi)有硝煙的AI革命中,中國(guó)再次復(fù)現(xiàn)了“兩彈一星”的奇跡——既用最低的成本、最高的效率,在最嚴(yán)苛的技術(shù)封鎖下,完成了對(duì)西方霸權(quán)的彎道超車(chē)。
今天美國(guó)宣布對(duì)華禁運(yùn)高端顯卡,就相當(dāng)于當(dāng)年中蘇交惡。蘇聯(lián)撤走對(duì)華援助專(zhuān)家,妄圖通過(guò)這種方式來(lái)迫使我們知難而退,但是以鄧稼先和于敏為代表的中國(guó)科學(xué)家卻選擇迎難而上,最終創(chuàng)造了震驚世界的科技奇跡。
我現(xiàn)在看深度求索搞出來(lái)的DeepSeek模型,很是有種看于敏他們當(dāng)年搞出來(lái)的中國(guó)氫彈的感覺(jué)。在于敏的團(tuán)隊(duì)提出“于敏構(gòu)型”之前,全世界都是以美國(guó)人最先提出的“泰勒-烏拉姆構(gòu)型”(簡(jiǎn)稱TU構(gòu)型)作為指導(dǎo)原理開(kāi)發(fā)核聚變武器的,因?yàn)闅鋸椬钤缇褪敲绹?guó)人搞出來(lái)的嘛,完了蘇聯(lián)和英國(guó)也是跟著美國(guó)那一套學(xué)的。
我們搞氫彈一開(kāi)始也不例外,在2021年播出的電視劇《功勛》之《無(wú)名英雄于敏》中,雷佳音飾演的于敏在劇中有一場(chǎng)戲是這么演的:項(xiàng)目組根據(jù)美國(guó)科學(xué)期刊刊載的學(xué)術(shù)論文,大致推斷出了TU構(gòu)型的原理。
TU構(gòu)型沒(méi)有想象中的那么復(fù)雜,但是有一個(gè)缺點(diǎn)——試錯(cuò)成本太高,以當(dāng)時(shí)中國(guó)的國(guó)力來(lái)說(shuō)很難承受。如果要通過(guò)科學(xué)實(shí)驗(yàn)的方式來(lái)確認(rèn)這一技術(shù)路徑的可行性,我們至少要花費(fèi)3年的時(shí)間、并付出數(shù)億人民幣的成本,這對(duì)于當(dāng)時(shí)就吃飯都成普遍問(wèn)題的中國(guó)來(lái)說(shuō)是不可接受的。
二、中美氫彈競(jìng)賽:你有大力出奇跡,我有四兩撥千斤
在這種情況下,于敏力排眾議,決心帶領(lǐng)團(tuán)隊(duì)獨(dú)自摸索出一條適合中國(guó)國(guó)情的氫彈研制之路。在克服了常人難以想象的重重困難之后,1965年9月,于敏和他的同志們終于在理論研究上取得了突破性進(jìn)展。
此后,為了驗(yàn)證方案可行性,他帶領(lǐng)團(tuán)隊(duì)來(lái)到了中科院上海華東計(jì)算機(jī)研究所,動(dòng)用了當(dāng)時(shí)國(guó)內(nèi)最先進(jìn)的、同時(shí)也是唯一一臺(tái)能以每秒5萬(wàn)次的運(yùn)算速度進(jìn)行計(jì)算的電子計(jì)算機(jī)。兩個(gè)月后,于敏設(shè)想的模型在計(jì)算機(jī)驗(yàn)算中取得了成功,人類(lèi)的氫彈理論研究由此在西方模式之外延伸出了一條東方道路。從此之后,美國(guó)的TU構(gòu)型不再是解開(kāi)制造氫彈難題的唯一方程式,中國(guó)的于敏構(gòu)型猶如長(zhǎng)坂坡陣前的常山趙子龍,單槍匹馬,從80萬(wàn)曹軍的重重包圍之中,浴血?dú)⒊觥?span lang="EN-US">
有關(guān)TU構(gòu)型和于敏構(gòu)型二者的區(qū)別,我就這個(gè)問(wèn)題問(wèn)了一下DeepSeek,完了它給了我一個(gè)我覺(jué)得很有意思的回答:
用TU構(gòu)型來(lái)搞氫彈是典型“大力出奇跡”的做事邏輯,這種構(gòu)型的好處是簡(jiǎn)單粗暴,適于量產(chǎn)和造大氫彈。美國(guó)的B-41氫彈(2500萬(wàn)噸TNT)和蘇聯(lián)的“沙皇炸彈”(5000萬(wàn)噸TNT)均基于此設(shè)計(jì)。
但TU構(gòu)型也存在一些明顯缺點(diǎn)。該構(gòu)型好比一家美式連鎖快餐店,采用標(biāo)準(zhǔn)化生產(chǎn)流程,賣(mài)的都是預(yù)制菜。其中一些重要的食材,比如液態(tài)氘,需要超低溫保存。你為了保存它還得配一大堆昂貴的冷卻設(shè)備。這樣造出來(lái)的氫彈成本會(huì)很高,而且又笨又重。以美國(guó)第一種熱核武器試驗(yàn)裝置“常春藤麥克”為例,該裝置重達(dá)82噸,其中光制冷設(shè)備就占去了一半的重量。
而于敏構(gòu)型的思路則和TU構(gòu)型大相徑庭,DeepSeek管這叫“中式四兩撥千斤”。于敏構(gòu)型對(duì)于材料和計(jì)算的精度要求極高,相當(dāng)于用繡花針雕微縮景觀。利用這種技術(shù)造氫彈,燃料利用量要比TU構(gòu)型高得多,而且不依賴復(fù)雜的冷卻設(shè)備。所以,我們基于于敏構(gòu)型搞出來(lái)的中國(guó)第一顆氫彈就比美國(guó)的“常春藤麥克”輕巧得多,爆炸當(dāng)量雖然達(dá)到了300萬(wàn)噸TNT,但是總重卻僅有3噸。
和TU構(gòu)型相比,利用于敏構(gòu)型造出來(lái)的氫彈具有小而精的特點(diǎn),這對(duì)重量敏感的導(dǎo)彈和飛機(jī)特別友好。我國(guó)造出來(lái)的第一顆實(shí)戰(zhàn)化氫彈“狂飆一號(hào)”,甚至用強(qiáng)-5強(qiáng)擊機(jī)就能掛載。
不僅如此,我們還是在五常之中同時(shí)最少搞出氫彈的國(guó)家。美國(guó)用了8年零6個(gè)月,蘇聯(lián)用了4年,英國(guó)用了4年零7個(gè)月,法國(guó)用了8年零6個(gè)月,而中國(guó)只用了2年零8個(gè)月。此外,和主導(dǎo)了我國(guó)原子彈工程的鄧稼先等人不同,于敏是完全土生土長(zhǎng)的中國(guó)科學(xué)家,他系北大研究生畢業(yè),從未出國(guó)留學(xué),但研究水平高得嚇。甚至就連錢(qián)三強(qiáng)老爺子都曾對(duì)于敏做出過(guò)這樣的評(píng)價(jià):“于敏填補(bǔ)了我國(guó)原子核理論的空白。”
我為什么要在這里花這么長(zhǎng)的篇幅向大家介紹這段往事呢?因?yàn)槲以诔鲞@期節(jié)目的過(guò)程中看到了《科技日?qǐng)?bào)》在今年1月中旬刊登的一篇報(bào)道《深度求索大模型:“花小錢(qián)辦大事”》,其中有很多細(xì)節(jié),讓我越看越覺(jué)得有種歷史照進(jìn)當(dāng)下的深深感慨:
深度求索訓(xùn)練出來(lái)的DeepSeek-V3模型,相較上一代產(chǎn)品能力得到了大幅提升,但訓(xùn)練成本有557.6萬(wàn)美元,僅用了2048塊上一代H800顯卡,耗時(shí)不到兩個(gè)月。而相比之下,OpenAI僅僅是為了訓(xùn)練出GPT-4o模型就花了1億美元,用了1萬(wàn)塊更先進(jìn)的A100顯卡,花費(fèi)的時(shí)間也是深度求索的好幾倍。
包括創(chuàng)始人梁文鋒在內(nèi),深度求索團(tuán)隊(duì)規(guī)模僅有139人,而且這些研究人員基本上都是國(guó)內(nèi)頂尖高校的應(yīng)屆畢業(yè)生,又或者是還沒(méi)畢業(yè)的博四、博五的實(shí)習(xí)生,也還有一些畢業(yè)才幾年的年輕人。在接受采訪的過(guò)程中,梁文鋒特別提到,他們搞DeepSeek-V2模型的時(shí)候沒(méi)有用到海外回來(lái)的人,全都是咱中國(guó)本土培養(yǎng)出來(lái)的苗子。而反觀山姆·奧爾特曼的OpenAI呢?整個(gè)團(tuán)隊(duì)僅人員規(guī)模就達(dá)到了1200人,人員構(gòu)成復(fù)雜,美國(guó)本土培養(yǎng)出來(lái)的人才并不占絕對(duì)多數(shù),其中甚至還有不少華人面孔。
三、從于敏到梁文鋒,從氫彈到AI,一代中國(guó)人有一代中國(guó)人的使命和擔(dān)當(dāng)
1995年1月,香港曾經(jīng)上映過(guò)一部名叫《金玉滿堂》的美食賀歲電影,它尾聲部分的高潮情節(jié),有一場(chǎng)戲是這么演的:滿漢樓和超凡飲食集團(tuán)之間的滿漢全席大比拼進(jìn)入到了第三輪,雙方比試的菜肴是猴腦。猴子是保護(hù)動(dòng)物不能吃,所以雙方都只能另辟蹊徑。熊欣欣飾演的超凡飲食集團(tuán)老板,雖然廚藝過(guò)人、但品性敗壞的黃榮,以羊腦來(lái)代替猴腦,并用天九翅和虎鯊牙粉等金貴食材來(lái)調(diào)味,最后做出了可以媲美猴腦的“齊天大圣會(huì)虎鯊”,并且獲得了三位評(píng)委的一致好評(píng)。
《金玉滿堂》
為了壓倒?jié)M漢樓,黃榮在比賽過(guò)程中用盡了各種卑鄙手段。就在最后他自以為勝券在握,滿漢樓的所有權(quán)已是自己囊中之物的時(shí)候,滿漢樓一群土生土長(zhǎng)的中國(guó)廚師,尤其是鐘鎮(zhèn)濤飾演的廖杰和趙文卓飾演的龍崑保,他們硬是頂著各種不利因素,整出了一個(gè)令在場(chǎng)所有人都驚掉下巴的絕活:用椰子殼模仿猴子的腦殼,用神乎其神的刀工硬生生把豆腐腦給雕刻成了猴子腦的形狀,然后再用好幾種不同的常食動(dòng)物腦花來(lái)進(jìn)行混合調(diào)味,最后愣是烹調(diào)出了足以以假亂真的“生滾猴腦”,驚艷全場(chǎng)。
如今,在中美兩國(guó)如今這場(chǎng)你追我趕AI大角逐之中,我似乎也在奧爾特曼、扎克伯格和梁文鋒這些人的身上,看到了熟悉的影子。奧爾特曼、扎克伯格是黃榮,而梁文鋒則是廖杰、龍崑保。事實(shí)證明,要想把菜做得出彩,光靠猛堆料和使下三濫的招數(shù)是沒(méi)用的,得動(dòng)腦子,得別出心裁,最重要的是,得走正道。
做菜如此,做人做事也一樣。老子說(shuō),治大國(guó)如烹小鮮,我相信其中的一些哲學(xué)道理用來(lái)評(píng)價(jià)中美兩國(guó)的治國(guó)理政和發(fā)展道路也是適用的。
如果在另一個(gè)平行世界里,我們沒(méi)有搞出AI,梁文鋒也沒(méi)有創(chuàng)建深度求索,而是奧爾特曼他們的OpenAI公司工程師團(tuán)隊(duì)的一員。要是這樣的話,我相信中國(guó)人最后還是會(huì)研究出屬于我們自己的大語(yǔ)言模型的,只不過(guò)那就是《橫空出世》中李幼斌飾演的陸光達(dá)(原型是鄧稼先)和蘇聯(lián)專(zhuān)家的戲碼了:
《橫空出世》
美國(guó)采取極限制裁政策,宣布禁止對(duì)華出口一切高端芯片和顯卡,還要迫害并驅(qū)逐美國(guó)的中國(guó)科研人才。在舊金山教會(huì)區(qū)的先鋒大廈,OpenAI的總部里,梁文鋒正在收拾自己的工位,準(zhǔn)備不日啟程回國(guó)。在回國(guó)那天,舊金山下起了大雨,奧爾特曼開(kāi)著他的布加迪威龍,把梁文鋒送到機(jī)場(chǎng)。車(chē)停之后,梁文鋒打著傘,兩人緩緩走向候機(jī)樓,快到的時(shí)候,奧爾特曼一把將傘接過(guò)去,然后和梁文鋒說(shuō):
“梁,在這個(gè)世界上,傘永遠(yuǎn)掌握在高個(gè)子手中”。
梁文鋒聽(tīng)罷,一言不發(fā),只是徑直走出傘外,任憑滂沱大雨如何下。梁文鋒的眼神中寫(xiě)滿了堅(jiān)毅和不屈,那就是中國(guó)的人工智能科研工作者在面對(duì)美國(guó)同行時(shí)最直截了當(dāng)?shù)幕卮稹?span lang="EN-US">
不只是陸光達(dá),在那么多為了讓祖國(guó)的人工智能技術(shù)早日趕超世界先進(jìn)水平的中國(guó)科研團(tuán)隊(duì)里頭,他們之中也應(yīng)該會(huì)誕生一個(gè)馮石將軍。每當(dāng)聊起中美兩國(guó)的人工智能競(jìng)賽,這個(gè)馮石就會(huì)以一種雖然粗糙,但卻極富生命力的話語(yǔ)來(lái)激勵(lì)大家:
“人工智能,大語(yǔ)言模型,在今天這個(gè)世界上,要想我們不受欺負(fù),那就不能沒(méi)有這個(gè)東西,所以我們就是砸鍋賣(mài)鐵,也得把它搞出來(lái)。”
“中國(guó)的大語(yǔ)言模型比美國(guó)的落后,中國(guó)人用美國(guó)的ChatGPT還得看人家的臉色。這口氣窩囊啊,我忘不了我們中國(guó)的科研工作者被美國(guó)算力霸權(quán)擠兌欺凌的模樣,他們掙扎著、哀嘆著,還要忍受潤(rùn)人殖子們的冷嘲熱諷。廣大中國(guó)的普通網(wǎng)民更是可憐啊,人家封鎖你大陸的IP地址,你付了錢(qián)也不能大大方方地用,被美國(guó)抓到了還要封你的號(hào)。”
“可盡管這樣,咱屈服了嗎?沒(méi)有!咱中國(guó)人、中國(guó)的科研工作者,從來(lái)就沒(méi)怕過(guò)他美國(guó)!應(yīng)該說(shuō),美國(guó)是一個(gè)美麗的國(guó)家,美國(guó)有很多善良的人民,可他的政府,還有他的企業(yè),不應(yīng)該像現(xiàn)在這樣,動(dòng)不動(dòng)就要欺負(fù)你,讓你就想對(duì)他大喊一聲,NO!去你媽的!我就是咽不下這口氣!”
一代人有一代人的使命。
一代人有一代人的擔(dān)當(dāng)。
一代人有一代人咽不下的那口氣。
所以就有了一代人必須去摘下的“兩彈一星”。
橫空出世,莽昆侖,閱盡人間春色。
飛起玉龍三百萬(wàn),攪得周天寒徹。
以DeepSeek為代表的國(guó)產(chǎn)人工智能大語(yǔ)言模型,正在向我們招手。
看吶,同志們,我們的原子彈、氫彈又到了。
來(lái)源:孤煙暮蟬今日頭條號(hào)
1、本文只代表作者個(gè)人觀點(diǎn),不代表本站觀點(diǎn),僅供大家學(xué)習(xí)參考;
2、本站屬于非營(yíng)利性網(wǎng)站,如涉及版權(quán)和名譽(yù)問(wèn)題,請(qǐng)及時(shí)與本站聯(lián)系,我們將及時(shí)做相應(yīng)處理;
3、歡迎各位網(wǎng)友光臨閱覽,文明上網(wǎng),依法守規(guī),IP可查。
作者 相關(guān)信息
孤煙暮蟬:洋抖沒(méi)壓住,又冒出來(lái)個(gè)小紅書(shū),美國(guó)人
2025-01-26孤煙暮蟬:洋抖“難民”潤(rùn)華潮,美國(guó)掀起洋悟運(yùn)
2025-01-24孤煙暮蟬:見(jiàn)慣了殺人的美軍,看到解放軍救災(zāi),美
2025-01-20孤煙暮蟬:“中國(guó)人喜歡解放軍嗎?”國(guó)外社媒上
2025-01-02內(nèi)容 相關(guān)信息
孤煙暮蟬:從于敏到梁文鋒,當(dāng)年我們是怎么搞的氫彈,今天我們就怎么搞AI
2025-02-05? 昆侖專(zhuān)題 ?
? 高端精神 ?
? 新征程 新任務(wù) 新前景 ?
? 國(guó)策建言 ?
? 國(guó)資國(guó)企改革 ?
? 雄安新區(qū)建設(shè) ?
? 黨要管黨 從嚴(yán)治黨 ?
? 社會(huì)調(diào)查 ?