DeepSeek的橫空出世,估計讓很多人都懵了,較小的成本開銷,實現了很好的效果。估計很多人不服,不服沒有用,效果實實在在的放在那里。最讓有些人難過的地方,這是一群普通的中國年輕人,他們絕大部分在中國大陸上學,進入社會的時間也不是特別長,他們就搞出了這個震驚世界的產品。
這顛覆了傳統的理論體系,傳統的那個體系是中國人是不能做創新的,新進的技術要有人從國外引進。人工智能是需要大量對算力,中國因為先進的芯片受限,無法在人工智能領域領先世界。
一個DeepSeek讓這個理論都崩潰了。
這段時間,我也密集的和行業內的專家們進行了討論,昨天下午還參加了一個行業內的聚會,討論原因何在。
當然對這樣的一個技術,完全搞清楚還是需要時間,我也相信,人工智能再進入一個漢語的時代。
1.用專用模型優化通用模型。說這句話不知道有沒有人聽得懂。在大模型開始炒作的時候,openAI代表的公司,走的路線圖就是多模態通用大模型,關于這件事情我在我的書中,兩年前就指出,這有一定的問題。這兩年我陸陸續續的多次表達過。用通用的大模型,想用一個模型解決所有的事情,這是非常不現實的,這個過程需要大量的算力,而大量的數據也是冗余的,甚至是有干擾的。
我相信DeepSeek這個用的思路,是把通用的模型和專用模型結合了起來,我用一件事情,可以作為一個證明。DeepSeek會罵人了,而且他會模仿魯迅的風格,這個風格惟妙惟肖。用ChatGPT是不可能的,我認真研究以后相信, ChatGPT主要還是基于知識和邏輯進行訓練。事實上魯迅的語言風格,并不是知識,也不是邏輯,對語言進行專門的訓練和優化,才讓我們看到了,表達上多么有意思,基本的信息可能是一樣的,輸出的風格卻是完全不同。
用專用的模型進行專門的優化。跟著別人抄永遠沒有突破。然而一個改變卻可以有完全不一樣的感覺。
2.我們經常在說神經語網絡。其實人類的語言,就是一個編碼和解碼的系統,我們把世界的理解把知識,編碼成為語言,通過聲音傳遞到對方。對方進行解碼,獲取相關的信息。
世界上有很多語言,盡管今天有很多人看不起漢語,但是我們老祖宗創造的語言,是這個世界語言,最有生命力的語言,而我們的漢字,卻用最小的成本開銷,實現了最大的信息傳輸。
DeepSeek當今世界上對于漢字理解最深刻的模型,把對漢語和漢字的理解達到了至高的境界,同時也有利用漢語和漢字的能力,提升自己模型的效率。用低成本的開銷,獲得很好的計算、推理效果。
這件事情相信很多人心里聽了還是很不舒服,漢語和漢字又要被尊重了,他們動不動冒幾句英語不是顯得不那么高級了嗎?
作為一種高效的信息編碼,漢語在人工智能的處理過程中間。極大的提升了效率,也大大的降低了成本。
據說西方已經開始,重新去研究漢語了,甚至要去學習中文了,估計很多人沒有想到吧,沒有想到,你就會落后。
作者:項立剛 ;來源:立剛科技觀察微信號
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學習參考;
2、本站屬于非營利性網站,如涉及版權和名譽問題,請及時與本站聯系,我們將及時做相應處理;
3、歡迎各位網友光臨閱覽,文明上網,依法守規,IP可查。
作者 相關信息
內容 相關信息
? 昆侖專題 ?
? 高端精神 ?
? 新征程 新任務 新前景 ?
? 習近平治國理政 理論與實踐 ?
? 國策建言 ?
? 國資國企改革 ?
? 雄安新區建設 ?
? 黨要管黨 從嚴治黨 ?