久久99国产精品尤物-国产高清色播视频免费看-男生肌肌往女人桶爽视频-精品国产-91PORNY九色|www.jqdstudio.net

您好!今天是:2025年-4月13日-星期日

|  站內(nèi)搜索:
梁文鋒| 如何讓創(chuàng)新真發(fā)生?
點(diǎn)擊:2085  作者:梁文鋒    來源:王育琨頻道微信號(hào)  發(fā)布時(shí)間:2025-02-16 12:21:27

 

梁文鋒的首次深度專訪

 

DeepSeek引發(fā)全球震動(dòng),創(chuàng)始人梁文鋒卻極少露面。

 

還在浙江大學(xué)攻讀人工智能時(shí),梁文鋒就無比篤信人工智能一定會(huì)改變世界,而2008年,這還是一個(gè)不被認(rèn)同的執(zhí)念。

 

畢業(yè)后,他沒有像周圍人一樣去大廠做個(gè)程序員,而是躲在成都的廉價(jià)出租屋里,不停接受進(jìn)入諸多場景中嘗試的挫敗,最終切入了最復(fù)雜場景之一的金融,并成立了幻方。2023411日,幻方在發(fā)布做大模型公告時(shí),也引用了法國新浪潮導(dǎo)演特呂弗曾告誡青年導(dǎo)演的一句話:務(wù)必要瘋狂地懷抱雄心,且還要瘋狂地真誠。

 

今天分享的這篇文章,首發(fā)于2023524日,為暗涌Waves”對(duì)梁文峰的專訪,文中除了在做大模型必然涉及的錢、人、算力等話題外,還談到怎樣的組織架構(gòu)可以讓創(chuàng)新發(fā)生,以及人的瘋狂可以持續(xù)多久。希望對(duì)你有所啟發(fā),enjoy~

 

01

做研究,做探索

 

「暗涌」:前不久,幻方發(fā)公告決定下場做大模型,一家量化基金為什么要做這樣一件事?

 

梁文鋒:我們做大模型,其實(shí)跟量化和金融都沒有直接關(guān)系。我們獨(dú)建了一個(gè)名為深度求索的新公司來做這件事。

 

幻方的主要班底里,很多人是做人工智能的。當(dāng)時(shí)我們嘗試了很多場景,最終切入了足夠復(fù)雜的金融,而通用人工智能可能是下一個(gè)最難的事之一,所以對(duì)我們來說,這是一個(gè)怎么做的問題,而不是為什么做的問題。

 

「暗涌」:你們要自訓(xùn)一個(gè)大模型,還是某個(gè)垂直行業(yè)——比如金融相關(guān)的大模型?

 

梁文鋒:我們要做的是通用人工智能,也就是AGI。語言大模型可能是通往AGI的必經(jīng)之路,并且初步具備了AGI的特征,所以我們會(huì)從這里開始,后邊也會(huì)有視覺等。

 

「暗涌」:因?yàn)榇髲S的入局,很多創(chuàng)業(yè)型公司都放棄了只做通用型大模型的大方向。

 

梁文鋒:我們不會(huì)過早設(shè)計(jì)基于模型的一些應(yīng)用,會(huì)專注在大模型上。

 

「暗涌」:很多人認(rèn)為,創(chuàng)業(yè)公司在大廠形成共識(shí)后下場,已經(jīng)不是一個(gè)好的時(shí)間點(diǎn)。

 

梁文鋒:現(xiàn)在看起來,無論大廠,還是創(chuàng)業(yè)公司,都很難在短時(shí)間內(nèi)建立起碾壓對(duì)手的技術(shù)優(yōu)勢。因?yàn)橛?span lang="EN-US">OpenAI指路,又都基于公開論文和代碼,最晚明年,大廠和創(chuàng)業(yè)公司都會(huì)把自己的大語言模型做出來。

 

大廠和創(chuàng)業(yè)公司都各有機(jī)會(huì)。現(xiàn)有垂類場景不掌握在初創(chuàng)公司手上,這個(gè)階段對(duì)初創(chuàng)公司不太友好。但因?yàn)檫@種場景說到底也是分散的、碎片化的小需求,所以它又是更適合靈活的創(chuàng)業(yè)型組織的。從長期看,大模型應(yīng)用門檻會(huì)越來越低,初創(chuàng)公司在未來20年任何時(shí)候下場,也都有機(jī)會(huì)。

 

我們的目標(biāo)也很明確,就是不做垂類和應(yīng)用,而是做研究,做探索。

 

暗涌」:為什么你的定義是“做研究、做探索”?

 

梁文鋒:一種好奇心驅(qū)動(dòng)。從遠(yuǎn)處說,我們想去驗(yàn)證一些猜想。比如我們理解人類智能本質(zhì)可能就是語言,人的思維可能就是一個(gè)語言的過程。你以為你在思考,其實(shí)可能是你在腦子里編織語言。這意味著,在語言大模型上可能誕生出類人的人工智能(AGI)。

 

從近處說,GPT4還有很多待解之謎。我們?nèi)?fù)刻的同時(shí),也會(huì)做研究揭秘。

 

「暗涌」:但研究意味著要付出更大的成本。

 

梁文鋒:只做復(fù)刻的話,可以在公開論文或開源代碼基礎(chǔ)上,只需訓(xùn)練很少次數(shù),甚至只需finetune(微調(diào))一下,成本很低。而做研究,要做各種實(shí)驗(yàn)和對(duì)比,需要更多算力,對(duì)人員要求也更高,所以成本更高。

 

「暗涌」:那研究經(jīng)費(fèi)哪里來?

 

梁文鋒:幻方作為我們的出資人之一,有充足的研發(fā)預(yù)算,另外每年有幾個(gè)億的捐款預(yù)算,之前都是給公益機(jī)構(gòu),如果需要,也可以做些調(diào)整。

 

「暗涌」:但做基礎(chǔ)層大模型,沒有兩三億美元,連牌桌都上不了,我們?nèi)绾沃嗡某掷m(xù)投入?

 

梁文鋒:我們也在找不同出資方在談。接觸下來,感覺很多VC對(duì)做研究有顧慮,他們有退出需求,希望盡快做出產(chǎn)品商業(yè)化,而按照我們優(yōu)先做研究的思路,很難從VC那里獲得融資。但我們有算力和一個(gè)工程師團(tuán)隊(duì),相當(dāng)于有了一半籌碼。

 

「暗涌」:我們對(duì)商業(yè)模式做了哪些推演和設(shè)想?

 

梁文鋒:我們現(xiàn)在想的是,后邊可以把我們的訓(xùn)練結(jié)果大部分公開共享,這樣可以跟商業(yè)化有所結(jié)合。我們希望更多人,哪怕一個(gè)小 app都可以低成本去用上大模型,而不是技術(shù)只掌握在一部分人和公司手中,形成壟斷。

 

「暗涌」:一些大廠后期也會(huì)有一些服務(wù)提供,你們差異化的部分是什么?

 

梁文鋒:大廠的模型,可能會(huì)和他們的平臺(tái)或生態(tài)捆綁,而我們是完全自由的。

 

「暗涌」:無論如何,一個(gè)商業(yè)公司去做一種無限投入的研究性探索,都有些瘋狂。

 

梁文鋒:如果一定要找一個(gè)商業(yè)上的理由,它可能是找不到的,因?yàn)閯澆粊怼?span lang="EN-US">

 

從商業(yè)角度來講,基礎(chǔ)研究就是投入回報(bào)比很低的。OpenAI早期投資人投錢時(shí),想的一定不是我要拿回多少回報(bào),而是真的想做這個(gè)事。

 

我們現(xiàn)在比較確定的是,既然我們想做這個(gè)事,又有這個(gè)能力,這個(gè)時(shí)間點(diǎn)上,我們就是最合適人選之一。

 

02

 萬卡儲(chǔ)備與它的代價(jià)

 

「暗涌」:GPU是這次ChatGPT創(chuàng)業(yè)潮的稀缺品,你們在2021年就可以有先見之明,儲(chǔ)備了1萬枚。為什么?

 

梁文鋒:其實(shí)從最早的1張卡,到2015年的100張卡、2019年的1000張卡,再到一萬張,這個(gè)過程是逐步發(fā)生的。幾百張卡之前,我們托管在IDC,規(guī)模再變大時(shí),托管就沒法滿足要求了,就開始自建機(jī)房。

 

很多人會(huì)以為這里邊有一個(gè)不為人知的商業(yè)邏輯,但其實(shí),主要是好奇心驅(qū)動(dòng)。

 

「暗涌」:什么樣的好奇心?

 

梁文鋒:對(duì) AI 能力邊界的好奇。對(duì)很多行外人來說,ChatGPT 這波浪潮沖擊特別大;但對(duì)行內(nèi)人來說,2012 AlexNet 帶來的沖擊已經(jīng)引領(lǐng)一個(gè)新的時(shí)代。AlexNet 的錯(cuò)誤率遠(yuǎn)低于當(dāng)時(shí)其他模型,復(fù)蘇了沉睡幾十年的神經(jīng)網(wǎng)絡(luò)研究。雖然具體技術(shù)方向一直在變,但模型、數(shù)據(jù)和算力這三者的組合是不變的,特別是當(dāng) 2020  OpenAI 發(fā)布 GPT3 后,方向很清楚,需要大量算力;但即便 2021 年,我們投入建設(shè)螢火二號(hào)時(shí),大部分人還是無法理解。

 

「暗涌」:所以2012年起,你們就開始關(guān)注到算力的儲(chǔ)備?

 

梁文鋒:對(duì)研究員來說,對(duì)算力的渴求是永無止境的。做了小規(guī)模實(shí)驗(yàn)后,總想做更大規(guī)模的實(shí)驗(yàn)。那之后,我們也會(huì)有意識(shí)地去部署盡可能多的算力。

 

「暗涌」:很多人以為搭這個(gè)計(jì)算機(jī)集群,是量化私募業(yè)務(wù)會(huì)用到機(jī)器學(xué)習(xí)做價(jià)格預(yù)測?

 

梁文鋒:如果單純只做量化投資,很少的卡也能達(dá)到目的。我們在投資外做了大量研究,更想搞清楚什么樣的范式可以完整地描述整個(gè)金融市場,有沒有更簡潔的表達(dá)方式,不同范式能力邊界在哪,這些范式是不是有更廣泛適用,等等。

 

「暗涌」:但這個(gè)過程也是一個(gè)燒錢行為。

 

梁文鋒:一件激動(dòng)人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻非娜恕?span lang="EN-US">

 

「暗涌」:顯卡通常會(huì)以20%的速度在折損。

 

梁文鋒:我們沒有精確計(jì)算過,但應(yīng)該沒這么多。英偉達(dá)的顯卡是硬通貨,即使是很多年前的老卡,也還有很多人在用。我們之前退役的老卡,二手處理時(shí)還挺值錢的,沒虧太多。

 

「暗涌」:搭一個(gè)計(jì)算機(jī)集群,維護(hù)費(fèi)用,人工成本,甚至電費(fèi)也都是不菲的支出。

 

梁文鋒:電費(fèi)和維護(hù)費(fèi)用其實(shí)是很低的,這些支出每年只占硬件造價(jià)的1%左右。人工成本不低,但人工成本也是對(duì)未來的投資,是公司最大的資產(chǎn)。我們選的人也會(huì)相對(duì)樸實(shí)一點(diǎn),有好奇心,來這里有機(jī)會(huì)去做研究。

 

「暗涌」:2021年,幻方是亞太地區(qū)第一批拿到A100顯卡的公司,為什么會(huì)比一些云廠商更早?

 

梁文鋒:我們很早就對(duì)新卡做了預(yù)研、測試和規(guī)劃。至于一些云廠商,據(jù)我所知,他們之前的需求都是分散的,直到2022年自動(dòng)駕駛,有租用機(jī)器做訓(xùn)練的需求,又有付費(fèi)能力,一些云廠商才去把基礎(chǔ)設(shè)施建好。大廠很難單純?nèi)プ鲅芯浚鲇?xùn)練,它更多會(huì)是業(yè)務(wù)需求驅(qū)動(dòng)。

 

「暗涌」:你會(huì)如何看大模型的競爭格局?

 

梁文鋒:大廠肯定有優(yōu)勢,但如果不能很快應(yīng)用,大廠也不一定能持續(xù)堅(jiān)持,因?yàn)樗枰吹浇Y(jié)果。

 

頭部的創(chuàng)業(yè)公司也有技術(shù)做得很扎實(shí)的,但和老的一波AI創(chuàng)業(yè)公司一樣,都要面對(duì)商業(yè)化難題。

 

「暗涌」:一些人會(huì)覺得一個(gè)量化基金卻強(qiáng)調(diào)自己做AI,是為其他業(yè)務(wù)吹泡泡。

 

梁文鋒:但其實(shí)我們的量化基金已經(jīng)基本不怎么對(duì)外募集了。

 

「暗涌」:你會(huì)如何去辨別哪些是AI信仰者,哪些是投機(jī)者?

梁文鋒:信仰者會(huì)之前就在這里,之后也在這里。他們更會(huì)去批量買卡,或者跟云廠商簽長協(xié)議,而不是短期去租。

 

03

如何讓創(chuàng)新真正發(fā)生

 

「暗涌」:深度求索團(tuán)隊(duì)的招聘進(jìn)展如何?

 

梁文鋒:初始團(tuán)隊(duì)已經(jīng)集結(jié)到位,前期因?yàn)槿耸植粔颍瑫?huì)從幻方臨時(shí)借調(diào)一部分人過去。去年底ChatGPT3.5風(fēng)靡時(shí),我們就開始動(dòng)手招聘了,不過我們依然需要更多的人加入。

 

「暗涌」:大模型創(chuàng)業(yè)的人才也是稀缺的,有投資人說很多適合的人才可能只在OpenAIFacebookAI Research 等巨頭的AI lab里。你們會(huì)去海外挖這類人才嗎?

 

梁文鋒:如果追求短期目標(biāo),找現(xiàn)成有經(jīng)驗(yàn)的人是對(duì)的。但如果看長遠(yuǎn),經(jīng)驗(yàn)就沒那么重要,基礎(chǔ)能力、創(chuàng)造性、熱愛等更重要。從這個(gè)角度看,國內(nèi)合適的候選人就不少。

 

「暗涌」:為什么經(jīng)驗(yàn)沒那么重要?

 

梁文鋒:不一定是做過這件事的人才能做這件事。幻方招人有條原則是,看能力,而不是看經(jīng)驗(yàn)。我們的核心技術(shù)崗位,基本以應(yīng)屆和畢業(yè)一兩年的人為主。

 

「暗涌」:在創(chuàng)新業(yè)務(wù)上,你覺得經(jīng)驗(yàn)是阻礙嗎?

 

梁文鋒:做一件事,有經(jīng)驗(yàn)的人會(huì)不假思索告訴你,應(yīng)該這樣做,但沒有經(jīng)驗(yàn)的人,會(huì)反復(fù)摸索、很認(rèn)真去想應(yīng)該怎么做,然后找到一個(gè)符合當(dāng)前實(shí)際情況的解決辦法。

 

「暗涌」:幻方從一個(gè)完全無金融基因的外行,切入到這個(gè)行業(yè),幾年內(nèi)做到頭部,這條招人法則是其中秘密之一嗎?

 

梁文鋒:我們的核心團(tuán)隊(duì),連我自己,一開始都沒有量化經(jīng)驗(yàn),這一點(diǎn)很特殊。不能說是成功的秘密,但這是幻方的文化之一。我們不會(huì)故意回避有經(jīng)驗(yàn)的人,但更多是看能力。

 

拿銷售這個(gè)崗位舉個(gè)例子。我們的兩個(gè)主力銷售,都是這個(gè)行業(yè)的素人。一個(gè)原來做德國機(jī)械品類外貿(mào)的,一個(gè)是原來在券商做后臺(tái)寫代碼。他們進(jìn)入這個(gè)行業(yè)時(shí),沒有經(jīng)驗(yàn),沒有資源,沒有積累。

 

而現(xiàn)在我們可能是唯一一家能以直銷為主的大私募。做直銷意味著不用給中間商分費(fèi)用,同樣規(guī)模和業(yè)績下,利潤率更高,很多家會(huì)試圖模仿我們,但并沒有成功。

 

「暗涌」:為什么很多家試圖模仿你們,卻沒有成功?

 

梁文鋒:因?yàn)閮H憑這一點(diǎn)不足以讓創(chuàng)新發(fā)生。它需要和公司的文化和管理相匹配。

 

事實(shí)上,第一年他們什么都做不出來,第二年才開始有點(diǎn)成績。但我們的考核標(biāo)準(zhǔn)和一般公司不太一樣。我們沒有 KPI,也沒有所謂的任務(wù)。

 

「暗涌」:那你們的考核標(biāo)準(zhǔn)是?

 

梁文鋒:我們不像一般公司,看重客戶下單量,我們的銷售賣多少和提成不是一開始就算好的,而會(huì)更鼓勵(lì)銷售去發(fā)展自己的圈子,認(rèn)識(shí)更多人,產(chǎn)生更大影響力。

 

因?yàn)槲覀冋J(rèn)為,一個(gè)讓客戶信任的正直的銷售,可能在短時(shí)間內(nèi)做不到讓客戶來下單,但可以讓你覺得他是個(gè)靠譜的人。

 

「暗涌」:選來合適的人后,用何種方式讓他進(jìn)入狀態(tài)?

 

梁文鋒:交給他重要的事,并且不干預(yù)他。讓他自己想辦法,自己發(fā)揮。

 

其實(shí),一家公司的基因是很難被模仿的。比如說招沒有經(jīng)驗(yàn)的人,怎么判斷他的潛力,招進(jìn)來之后如何才能讓他成長,這些都沒法直接模仿。

 

「暗涌」:你覺得什么是打造一個(gè)創(chuàng)新型組織的必要條件?

 

梁文鋒:我們的總結(jié)是,創(chuàng)新需要盡可能少的干預(yù)和管理,讓每個(gè)人有自由發(fā)揮的空間和試錯(cuò)機(jī)會(huì)。創(chuàng)新往往都是自己產(chǎn)生的,不是刻意安排的,更不是教出來的。

 

「暗涌」:這是一種非常規(guī)的管理方式,這種情況下你如何確保一個(gè)人做事是有效率的,而且在你要的方向上?

 

梁文鋒:招人時(shí)確保價(jià)值觀一致,然后通過企業(yè)文化來確保步調(diào)一致。當(dāng)然,我們并沒有一個(gè)成文的企業(yè)文化,因?yàn)樗谐晌臇|西,又會(huì)阻礙創(chuàng)新。更多時(shí)候,是管理者的以身示范,遇到一件事,你如何做決策,會(huì)成為一種準(zhǔn)則。

 

「暗涌」:你覺得這波做大模型的競爭中,創(chuàng)業(yè)公司更適合創(chuàng)新的組織架構(gòu)會(huì)是和大廠競爭的破局點(diǎn)嗎?

 

梁文鋒:按照教科書的方法論來推導(dǎo)創(chuàng)業(yè)公司,在當(dāng)下,他們做的事,都是活不下來的。

 

但市場是變化的。真正的決定力量往往不是一些現(xiàn)成的規(guī)則和條件,而是一種適應(yīng)和調(diào)整變化的能力。

 

很多大公司的組織結(jié)構(gòu)已經(jīng)不能快速響應(yīng)和快速做事,而且他們很容易讓之前的經(jīng)驗(yàn)和慣性成為束縛,而這波AI新浪潮之下,一定會(huì)有一批新公司誕生。

 

04

真正的瘋狂

 

「暗涌」:做這樣一件事,最讓你們興奮的是什么?

 

梁文鋒:去搞清我們的猜想是不是事實(shí),如果是對(duì)的,就會(huì)很興奮了。

 

「暗涌」:這次大模型招人,什么是我們必卡的條件?

 

梁文鋒:熱愛,扎實(shí)的基礎(chǔ)能力。其他都沒那么重要。

 

「暗涌」:這種人容易找到嗎?

 

梁文鋒:他們的熱情通常會(huì)表現(xiàn)出來,因?yàn)樗娴暮芟胱鲞@件事,所以這些人往往同時(shí)也在找你。

 

「暗涌」:大模型可能是一件無休止投入的事,付出的代價(jià)會(huì)讓你們顧慮嗎?

 

梁文鋒:創(chuàng)新就是昂貴且低效的,有時(shí)候伴隨著浪費(fèi)。所以經(jīng)濟(jì)發(fā)展到一定程度之后,才能夠出現(xiàn)創(chuàng)新。很窮的時(shí)候,或者不是創(chuàng)新驅(qū)動(dòng)的行業(yè),成本和效率非常關(guān)鍵。看OpenAI也是燒了很多錢才出來。

 

「暗涌」:會(huì)覺得你們在做一件很瘋狂的事嗎?

 

梁文鋒:不知道是不是瘋狂,但這個(gè)世界存在很多無法用邏輯解釋的事,就像很多程序員,也是開源社區(qū)的瘋狂貢獻(xiàn)者,一天很累了,還要去貢獻(xiàn)代碼。

 

「暗涌」:這里邊會(huì)有一種精神獎(jiǎng)賞。

 

梁文鋒:類似你徒步50公里,整個(gè)身體是癱掉的,但精神很滿足。

 

「暗涌」:你覺得好奇心驅(qū)動(dòng)的瘋狂可以一直持續(xù)下去嗎?

 

梁文鋒:不是所有人都能瘋狂一輩子,但大部分人,在他年輕的那些年,可以完全沒有功利目的,投入地去做一件事。

 

來源:暗涌Waves

責(zé)任編輯:向太陽
特別申明:

1、本文只代表作者個(gè)人觀點(diǎn),不代表本站觀點(diǎn),僅供大家學(xué)習(xí)參考;

2、本站屬于非營利性網(wǎng)站,如涉及版權(quán)和名譽(yù)問題,請及時(shí)與本站聯(lián)系,我們將及時(shí)做相應(yīng)處理;

3、歡迎各位網(wǎng)友光臨閱覽,文明上網(wǎng),依法守規(guī),IP可查。

作者 相關(guān)信息

  • 梁文鋒| 如何讓創(chuàng)新真發(fā)生?

    2025-02-16
  • 內(nèi)容 相關(guān)信息

  • 梁文鋒| 如何讓創(chuàng)新真發(fā)生?

    2025-02-16
  • 熱點(diǎn)排行
  • 一周
  • 一月
  • 半年
  • 建言點(diǎn)贊
  • 一周
  • 一月
  • 半年
  • 友情鏈接
  • 人民網(wǎng)
  • 央視網(wǎng)
  • 新華網(wǎng)
  • 求是
  • 中國軍網(wǎng)
  • 中國經(jīng)濟(jì)網(wǎng)
  • 中國社會(huì)科學(xué)網(wǎng)
  • 中國科技網(wǎng)
  • 中國共產(chǎn)黨歷史和文獻(xiàn)網(wǎng)
  • 紅色文化網(wǎng)
  • 觀察者網(wǎng)
  • 參考消息
  • 環(huán)球網(wǎng)
  • 毛澤東思想旗幟網(wǎng)
  • 紅旗文稿
  • 紅歌會(huì)
  • 紅旗網(wǎng)
  • 烏有之鄉(xiāng)
  • 橘子洲頭
  • 四月網(wǎng)
  • 新法家
  • 中紅網(wǎng)
  • 激流網(wǎng)
  • 宣講家網(wǎng)
  • 中共黨史網(wǎng)
  • 國史網(wǎng)
  • 全國黨建網(wǎng)
  • 中國集體經(jīng)濟(jì)網(wǎng)
  • 中國延安精神研究會(huì)
  • 西北革命歷史網(wǎng)
  • 善之淵
  • 俄羅斯衛(wèi)星通訊社
  • 趙曉魯律師事務(wù)所
  • 烽火HOME
  • 備案/許可證編號(hào):京ICP備15015626號(hào)-1 昆侖策研究院 版權(quán)所有 舉報(bào)郵箱:kunlunce@yeah.net