“人工智能已經炒過幾回了,經歷了幾個夏天和冬天,忽冷忽熱;現在終于到了秋天了,是收獲的季節了。” 中國信息化百人會學術委員、中國工程院院士李國杰近日在“2017中科曙光智能峰會”上,如此評價當前正熱門的人工智能產業。
盡管到了收獲的季節,盡管中國AI產業的發展速度舉世矚目,但是我們仍然面對AI基礎設施建設不足,以及AI創業公司難以做大做強的問題。對于這些問題,李國杰院士有以下思考:
(根據李國杰演講速記做了遵照原意的部分修改)
話題一:大數據、AI融入各產業將推動經濟邁入新的繁榮期
現在是人工智能2.0時代,過去二十年算一代。但是,國際上通用的說法是人工智能已經經過了兩波的發展。第一波是上個世紀50年代-80年代,是做編寫知識搞邏輯推理為主。第二波是從80年代開始,以統計學習、概率推理為主,也就是人工神經網絡為主,這里面的感知和學習能力比較強,但是抽象的能力比較弱,推理的能力也比較弱。從2010年開始做的是第三波,就是加強抽象的能力和推理能力,保持感知和學習能力,對環境有著更強的自適應性,與過去六十年相比,更加通用化,在各個行業里面引領著經濟下一波大的浪潮。
我自己畫了一個示意圖,經濟發展變化是有周期性的,比如從二戰以后進入到第四波,就是以電子計算機、石化為主驅動的發展;到了第五波就進入了互聯網,九十年代開始,移動通信,軟件驅動經濟發展。
大家注意,從九十年代開始那波到2008年金融危機的時候,經濟形勢已經開始走下坡路了,現在是經濟的低潮期,整個增速是在2%左右,發展中國家也是平均5%左右。所以,過去十年正好是經濟低潮的時候,也是研究最活躍的時間,所以今后的二十年,正好是人工智能技術基本創新爆發期,在今后的一、二十年會產生觸發2030年開始的第六波的繁榮期。
這里得出什么結論呢?在未來10-15年,對經濟貢獻最大的可能不是大數據和人工智能的新技術,而是信息技術包括大數據和人工智能融入各個產業的新產品,提供個性化產品和服務的新業態,產業跨接融合的新模式,這些創新主要是和已知技術的新組合。任何新技術的推廣需要10-20年的時間。在經濟衰退的復蘇期要特別重視基礎性技術的發明,未來10-15年應力爭在大數據和人工智能領域做出像電子計算機、集成電路、互聯網一樣的重大發明,但是重大發明是自己冒出來的,不是規劃出來的。
歷史上重大基礎發明都是經過較長時間的技術改進和擴散之后才產生巨大經濟效益,人工智能也不應例外。很多公司都預測,從2016年到2025年的10年內,關注汽車、消費品、電力、物流等行業的數字化轉型有望帶來100萬億美金。
話題二:人工智能和大數據基本是一回事 要重視剛性需求
大家流行的說法,是人工智能=A+B+C。我個人的看法,人工智能和大數據基本一回事,A+B+C+D+E。A是算法,B是基本理論和基礎設施,C是計算能力,D是領域知識,E是生態環境。
發展人工智能和大數據要重視大眾的剛性需求,2011年我跟徐志偉寫了一篇文章在CACM上發表了,與“Computing for the Masses”的追求一樣,我們要努力實現“Big Data for Masses,AI for the Masses”,不能只關注高端消費人群。發展大數據與人工智能要重視大眾的剛性需求(如健康、出行、安全等)。要滿足大眾剛性需求要有基礎設施,過去工業化時代就是所謂 “鐵公機”,鐵路、公路、機場。信息時代的基礎設施是互聯網、云計算中心。到了智能化階段的基礎設施是大數據中心、機器學習訓練平臺等。大數據的存儲分析和機器學習能力已成為新的基礎設施需求,計算機能力的高低將決定人工智能產業和智能服務的水平。
話題三:公用的大數據分析平臺和機器學習訓練平臺
目前,網絡服務的龍頭企業(BAT、滴滴打車等)都有自己的大數據平臺,但智能軟件和服務行業每個中小型創業公司都建立自己的機器學習訓練平臺,既無必要也不可能。各地雙創園區要建立共享的大數據分析平臺和機器學習訓練平臺,這是新時代的重要基礎設施。
我國一半以上的HPC用于大數據和AI,過去HPC主要用于科學計算,現在HPC主要用于大數據分析和機器學習。2015年,HPC在數據分析與機器學習領域的應用只有27%,2016年達到了48%,今年有進一步提升。另外每個行業都需要AI,每個行業分別做是很累人的,有些東西是又有區別又有共性,我的想法是將來要有生產每個行業的AI引擎生產線,前面有公共的東西做局部化調整,有局部的參數調整,調完了以后出一個行業的AI引進來。
話題四:擺脫人工智能創業公司被收購的命運
人工智能創業公司只有兩個命運:一個是被大公司收購,一個是倒閉。即使像科大訊飛這樣的大企業,科大訊飛市值約700億元,凈利潤不到1.7億元,市盈率已經超過300倍,所以如何提高凈利潤是AI公司的一大困擾。
人工智能企業史說明,算法固然很重要,但是光有算法決定不了公司的命運。AI公司要在賣產品、授權、廣告、服務模式中找到新的賺錢模式,或者另外開辟技術變成錢的商業模式。AI公司要做大做強,不但要有一技之長,而且要有自己的平臺和特有的數據,軟件和硬件都要有過人的實力。
現在的問題,我國人工智能應用技術與國外差距不大,有些應用領域已經超過美國。但是基礎軟硬件與國外還有較大差距。在全球企業2000強名單中,美國有14家芯片公司和14家軟件公司,中國尚未沒有一家,我講的是以軟件作為主要產業的公司。全球集成電路企業前20名沒有一家中國企業。我國集成電路與國外仍有兩代差距。
話題五:發展AI要打造完整的生態系統
所以人工智能產業要像一棵大樹,必須扎根在系統結構和軟件理論的深土中,發展人工智能不能停留在算法層面,要關注從算法、軟件、人機截面到系統結構和芯片這一完整的產業鏈和生態系統。
發展人工智能和大數據,還是要特別重視基礎的東西。中國人很重“名”,“名不正則言不順”,信息領域不斷創造新名詞,一旦新名詞(新學科)上升為國家意志,原來的基礎學科就被邊緣化,現在以“系統結構”和“基礎軟件”申請國家項目,已經很難拿到經費。去年國家自然科學基金計算機學科的4863項申請項目中,計算機科學的基礎理論只有16項,計算機體系結構22項,程序設計語言及支撐環境13項,高速數據傳輸技術2項。但是,計算機圖像與視頻處理有439項,模式識別理論及應用357項,人工智能應用258項,這是巨大的反差。沒有基礎的話,將來還是難以扳回局面。
話題六:人工智能本質還是計算機科學
什么是人工智能?人工智能從科學上講,它是計算機科學的前沿研究,從應用來講,它是計算機技術的的非平凡應用。人工智能本就是計算機技術,現在很多人講人工智能是新的科學,內容涉及腦科學、計算機科學、統計學、社會科學等。但是迄今為止,腦科學(神經科學)對人工智能的貢獻很小,統計學對推動機器學習的崛起起了較大作用,但是沒有人把人工智能看成統計學的分支。
所以目前來講,人工智能本質上是計算機學科的一個分支,所以智能化的前提是計算機化,目前不存在脫離計算機的人工智能。所以說,沒有計算就沒有智能。
有人說信息化時代已經過去了,現在是智能化的時代,這恐怕不夠全面,智能時代不是后信息時代,真正的后信息時代可能是生物時代。與其過分強調智能與數字化、網絡化的區別,不如多強調智能化與信息化的聯系,數字化和網絡化沒有做好,智能化就是空話。
我們吸取歷史上的教訓,既要重視智能應用的特殊要求,但是也不能忽視通用的計算機主流技術的巨大包容能力。
話題七:產學研的結合
中科曙光公司與人工智能的淵源已久,曙光公司是國家智能計算機研究開發中心創辦的企業,是國家863計劃智能計算機主題長期支持下成長起來的高技術公司,智能應用一直是國家智能計算機研究開發中心和曙光公司關注的重點之一。
上世紀九十年代在建立了國家智能計算機研究開發中心的中國科大分中心,專門從事語音識別/合成的評測,后來這個中心孵化出科大訊飛公司。
中科曙光和現在比較熱門的芯片公司寒武紀是同根生的兄弟公司,寒武紀研究芯片不但用在華為的手機上,也用在了曙光服務器上。
我們要特別注重知識的融合,錢老(編輯注:錢學森)說過“必集大成,才能得智慧”,人工智能是對付復雜性的科學,發展人工智能不能追求“另立山頭,分道揚鑣”,要跟其它學科密切融合。
如何看待領域知識呢?10月19日,谷歌DeepMind團隊新成果,名為阿爾法元的機器完全靠增強型自我學習,訓練3天就戰勝了阿爾法狗,比分100:0。這表明在某些領域,AI不再需要人類知識。過去我們相信知識就是力量,現在有些領域數據和機器學習比知識和人類經驗更有力量。
最后引用一段話,是美國曼哈頓負責人奧本海默在二戰勝利以后說的一段話:“我們得到了一棵碩果累累的大樹,并拼命地搖晃,結果得到了雷達和原子彈……其全部精神實質在于對已知的瘋狂而粗暴掠奪,而毫無對未知的認真而謙恭地探索”。
人工智能已經六十年了,我們是拼命搖晃這棵大樹不變,還是懷抱對未知的認真和謙恭,自己新種幾棵樹苗?深度學習為什么這么有效,沒有人講得清楚。最近以色列科學家提出“信息瓶頸”理論,發現深度學習與量子物理的相似之處。
人工智能與大數據任重而道遠。最后以一首詩結束這次報告:
莫言下嶺便無難,
賺得行人空歡喜。
正入萬山圈子里,
一山放過一山攔。
——宋•楊萬里《過松原晨炊漆公店》
(本文來源:雷克世界)
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學習參考;
2、本站屬于非營利性網站,如涉及版權和名譽問題,請及時與本站聯系,我們將及時做相應處理;
3、歡迎各位網友光臨閱覽,文明上網,依法守規,IP可查。
作者 相關信息
? 昆侖專題 ?
? 十九大報告深度談 ?
? 新征程 新任務 新前景 ?
? 習近平治國理政 理論與實踐 ?
? 我為中國夢獻一策 ?
? 國資國企改革 ?
? 雄安新區建設 ?
? 黨要管黨 從嚴治黨 ?
圖片新聞