熱門文章
第三波人工智能潮與以往有何不同?
發布時間:2019-06-26 分類:趨勢研究
[本輪人工智能主要算法的靈感來源于認知科學、博弈論和量子力學等廣闊的領域,大數據驅動的算法主導的科學研究范式(第四范式)被應用于各個學科的研究,他山之石可以攻玉,其他學科的進展也能反哺人工智能的創新,并可能起到至關重要的革命性作用,特別是腦科學、心理學等學科發展可能與AI的發展形成閉環和相互促進的良性關系。]
[由于受當時歷史條件所限,AI能做的事情很有限,大眾對AI前景不切實際的樂觀和AI所承諾的能力均未能兌現,引發上世紀70年代長達10年的首次AI寒冬。]
[摩爾定律驅動算力在過去30年提升了百萬倍,為數據驅動的人工智能提供了強勁的動力。]
人工智能(AI)自1956年誕生以來,60多年來經歷了“三起二落”的波折的發展歷程。
2016年,隨著谷歌圍棋機器人AlphaGo的一戰成名,從國家到企業層面,隨處都能見到人工智能的身影。隨著經濟增速的放緩以及資本的退潮,人工智能的“寒冬論”又開始甚囂塵上,“一哄而上,一哄而散”帶來了一地雞毛,人工智能的未來,究竟何去何從?
人工智能歷史會重演嗎
AI之父、圖靈獎獲得者約翰·麥卡錫在1956年的達特茅斯夏季研討會締造“人工智能”一詞時,曾有不同的聲音。在英語中,Artificial(人工、人造)一詞略帶貶義,如人造革、人造絲等,暗藏著一點“假”的意思,當時英國的一些學者更愿意使用“思考機器”的提法。阿蘭·圖靈憑借他的“謎一樣的機器”(enigma)破解了德軍密碼,大大加速了二戰結束的進程,減少了上千萬人的傷亡,居功至偉,他提出了著名問題:機器可以思考嗎?
從這個角度看,其實人工智能這個術語還是貼切的。今天,AI的核心支柱——機器學習并不是在進行主動的學習,而只是在被“訓練”,更本質的來說,只是通過尋找最小誤差值的方法來進行參數擬合(Fitting),并不具有任何意識。在小數據等需要人類認知能力的領域,今天的AI就連5歲的孩子都比不上,例如,兒童在看到幾張照片后,就能輕松地學習到“貓”的概念,而“先進的”卷積神經網絡需要對大量的標簽數據進行學習才能完成類似的任務。即便如是,得益于算法的改進和指數增長的計算能力,在特定的場景中,AI已經展現出令人驚嘆的能力,并且對部分行業的創新產生了關鍵影響。
麥卡錫對人工智能的定義是:制造智能機器的科學與工程。在人工智能誕生后的十多年里,科學家們致力于通過模仿人的思維來實現智能。今天的人工智能算法,例如神經網絡、知識圖譜和對話機器人的雛形在那時都已經出現,由于受當時歷史條件所限,AI能做的事情很有限,大眾對AI前景不切實際的樂觀和AI所承諾的能力均未能兌現,引發上世紀70年代長達10年的首次AI寒冬。
80年代初,日本成為了當時全球第二大經濟體,在技術上也積極謀求世界領先的地位,提出了“五代機”(第五代計算機,前四代計算機代表性技術分別是:電子管、晶體管、大規模集成電路和超大規模集成電路)的設想,英美等政府也被迫跟進,對相關技術進行了大量投資,同時,機器學習的神經網絡算法也出現了兩項突破?;谖锢韺W能量概念的霍普費爾德網絡被提出;在今天深度學習中仍然具有重要作用的“反向傳播”的方法被廣泛應用于神經網絡的參數訓練中,取得了不錯的效果,并成為今年(2019)圖靈獎得主杰弗瑞·辛頓(JefferyHinton)獲獎的重要依據之一;90年代初,時任貝爾實驗室負責人的楊力昆(YannLeCun,紐約大學教授,2019年圖靈獎得主,美國工程院院士,原FacebookAI研究院主任)實現了商用的手寫數字識別,美國有10%的支票的識別使用了該算法,1992年,采用簡單神經網絡控制的卡內基梅隆大學的首輛無人駕駛的裝甲車也上路了。盡管如此,但是受制于當時的計算力和數據量,人工智能逐漸湮沒于快速崛起的互聯網的奪目光芒中,但是,這個階段的理論儲備為今天的AI發展提供了重要的源泉(知識儲備)。
前兩次AI的繁榮具有兩個特點:一是從參與者來看,主要政府投資主導,企業參與度低,落地應用極為有限;二是技術上均是以邏輯推理為核心的符號主義占據了主導地位,神經網絡學派的發展長期被壓抑,客觀上,神經網絡所需要的數據量和算力條件當時也不成熟,AI的主要形式也因此表現為確定的推理,難以處理現實中遇到的大量不確定性問題。
當下處在第三波人工智能浪潮之上
互聯網30年的快速發展,社交網絡、物聯網和云計算所產生的海量數據為本輪人工智能的繁榮提供了燃料。摩爾定律驅動算力在過去30年提升了百萬倍,為數據驅動的人工智能提供了強勁的動力。2006年,加拿大科學家杰弗里·辛頓(GeoffreyHinton)教授等人一年之內連發三篇重量級論文,標志著深度學習時代的開啟。自2016年AlphaGo引爆了媒體以來,AI得到整個社會的關注。
與前兩次人工智能浪潮不同,很多和業務緊密結合的AI應用場景已經或正在落地,企業成為了最主要的推動者。技術上,深度學習作為機器學習的一種,放棄了之前符號主義的機械推理,而采用了基于概率的范式,使得應用場景得以大幅度地拓展。符號主義則以知識圖譜的形式延續下來,成為新一代搜索引擎的核心技術。
同時,繁榮之下的局限也是顯而易見的。首先,深度學習技術上缺乏理論的支撐,目前是模型的結構和訓練是經驗主義主導,未來深度學習理論的誕生將能減少算法對算力和數據的依賴;其次缺乏突破性的算法思想。深度學習中大紅大紫的卷積神經網絡(CNN)和長短時記憶網絡(LSTM)都是在上世紀八九十年代就被提出了的,只是囿于當時數據量和算力,才沒有流行。本輪人工智能繁榮中真正令人眼前一亮的創新點乏善可陳,對抗神經網絡(GAN)引入博弈論的思想、AlphaGo強化學習結合深度學習、自然語言處理中的詞向量等技術可以算是為數不多的重要創新。
經典力學和量子力學的發展過程與今天的深度學習近似:第谷收集了大量行星運動數據,他的助手開普勒在這些數據中發現了行星運動三大定律,但未能指出背后的原理,直到牛頓在三大定律基礎上提出萬有引力定律;在量子力學領域,人們很早就獲得了氫原子的光譜數據,但是無法解釋。今天,我們擁有大數據,也有一些不錯的深度學習模型,但是還缺乏理論的支撐。
本輪人工智能主要算法的靈感來源于認知科學、博弈論和量子力學等廣闊的領域,大數據驅動的算法主導的科學研究范式(第四范式)被應用于各個學科的研究,他山之石可以攻玉,其他學科的進展也能反哺人工智能的創新,并可能起到至關重要的革命性作用,特別是腦科學、心理學等學科發展可能與AI的發展形成閉環和相互促進的良性關系。
在工業界,除了金融、零售等少數數據條件好而且“離錢近”的行業,傳統行業在數字化轉型過程中,面臨數據采集、數據治理和缺乏人才等一系列挑戰、直接利用人工智能變現具有一定難度。換個角度看,這些行業也具有極大的潛力,可以先從一些簡單的“速贏”場景切入,逐步培育數據文化和人才,先對已有業務進行優化。
本輪人工智能的上半場在C端衣食住行方面都已普及,接下來的主戰場將在B端,企業不要總是想著風口,踏踏實實地將一個個AI場景落地才是王道。整個社會各行業的數字化轉型將持續數十年,即便學術界在未來十年在AI理論上沒有大的突破,對于行業的AI場景落地并不會產生太大的瓶頸效應,大部分企業AI場景并非一定要使用最酷炫的技術,合適的技術才是最好的。
根據Gartner的估計,未來企業對于預測算法的需求將指數增長,其中大部分場景并不需要追求極致的預測準確率,使用目前流行的框架和工具,普通程序員和商業分析師就能滿足大部分這類需求,對于少數核心場景,例如金融行業的風控,零售行業商品推薦,1%的準確率的提升都會帶來巨大的價值,企業自然會在這些領域不遺余力地進行投入,數據科學家未來的用武之地也將轉移到這些領域。
今天,AI的主要目標不再是讓它像大腦一樣思考,而是利用其獨特的能力,做好人類的助手,如同工業革命解放我們的體力那樣,AI解放我們重復性工作所需的腦力,讓我們有更多的時間和精力從事更有價值的創造性工作。雖然,今天對于沒有意識的AI統治人類的擔心如同杞人憂天,但是我們已經看到大量的行業正在數字化轉型的進程中,現實物理世界被逐漸映射到虛擬的數字空間之中,主宰虛擬世界的算法如同法律,其在虛擬世界中的決策作用在現實生活中不斷顯現,電影《黑客帝國》所預言的時代似乎已經觸手可及。AI正在成為人類新的潛意識,替我們進行著各項決定,雖然我們好像擁有最終決策權,卻對我們正生活在自己編織的信息繭房之中常常不自知。
(作者鄔學寧系數據科學50人成員、復旦大學人工智能客座講師)