16625份AI論文透露:深度學習正在走向終點?
麻省理工科技評論在1月25日發布的一篇文章中,分析了截至2018年11月18日,論文數據庫中arXiv的16625份關於AI的論文。從分析結果看,“AI”概念的風靡,有三個典型時期:90年代末21世紀初機器學習興起,2010年代初神經網絡概念復辟,近幾年強化學習概念捲土重來。
值得注意的是,arXiv的AI論文模塊始於1993年,而“人工智能”的概念可以追溯到1950年,因此這一隻能反饋近26年以來的AI研究。而且,arXiv每年收錄的論文,也僅代表當時人工智能領域的一部分研究。不過,它仍然是觀測AI行業研究趨勢的最佳窗口。
我們接下來就來看一下,16625份論文提供了哪些信息。
起點:解救程序員
基於知識的系統,由人類將知識賦予計算機,而計算機承擔知識的存儲和管理功能,幫助人類解決問題。轉變為機器學習後,計算機可以自主學習所有的人類知識。這是21世紀以來AI研究最大的轉變。
在相關論文提及率最高的100個單詞中,“邏輯”“約束”“規則”等基於知識系統的詞語,自90年代以來出現率顯著下降,而“數據”“網絡”“性能”增長最為明顯。
麻省理工科技評論稱,這種變化的原因非常好理解。上世紀80年代,基於知識的系統廣受歡迎,但各種各樣的項目推進的同時,研究者遇到了一個問題:需要編寫太多太多的規則,才能讓計算機作出有效決策,這種成本太過高昂,研究者的動力也就隨之減少。
機器學習實際上是解決這個問題的方案。機器學習讓計算機從一系列數據中提取規則,把程序員從編碼“邏輯”“規則”“約束”中解救了出來。
神經網絡井噴
機器學習開始登上舞台,但是向深度學習的轉變並沒有馬上出現。神經網絡是深度學習的核心機制,但麻省理工科技評論對16625篇論文關鍵字檢索的結果顯示,研究者還嘗試了各種其他“提取規則”的方法,包括貝葉斯網絡、馬爾可夫模型、進化算法和支持向量機(support vector machines,SVM)等。
上世紀90年代到21世紀初,這些方法都在相互競爭。一直到2012年,視覺識別領域一年一度的ImageNet競賽中,多倫多大學的Geoffrey Hinton教授和兩個學生(Ilya Sutskever 和Alex Krizhevsky)的AlexNet橫空出世,把圖像識別的Top-5錯誤率(給出的前N個答案中有一個是正確答案的概率)降低到了15.3%,比亞軍的26.5%低了41%)。
為了構建識別成千上萬圖像的系統,該團隊採用了卷積神經網絡。為避免數據過度擬合,AlexNet採用的神經網絡還使用了數據擴充(平移、翻轉等),以及隨機(概率為0.5)“刪除”(dropout)一些神經元來減少工作量等。
Geoffrey Hinton教授當時強調,深度對最終的識別精度尤為重要。深度學習技術由此引起了廣泛關注。它從圖像識別領域逐漸擴展開來,神經網絡概念也隨之井噴。
強化學習興起
在深度學習推廣數年後,人工智能發生了迄今為止的最後一次重要轉變,即強化學習的興起。
機器學習算法可以分為三種:有監督的學習,無監督的學習,以及強化學習。
有監督的學習給機器提供已經標記過的數據,機器學習的那些行為都是正確的行為。例如,標記過的花卉數據集告訴正在學習的機器模型,哪些照片分別是玫瑰、雛菊和水仙。而在給出一張測試圖像時,機器應該把它和學習的數據進行對比,判斷那是玫瑰、雛菊還是水仙。
有監督的學習最適用於解決有參照背景的問題。例如物品分類,或是基於面積、位置和公交便利程度判斷住宅價格。所以,它是是最常用的也是最實用的機器學習算法。
標記數據集並不容易,所以也有無監督的學習。提供給無監督學習的數據集沒有特定的期望結果,或是正確答案。機器需要自己提取特徵和規律,來理解數據。
無監督學習的應用場景,包括銀行通過賬戶異常行為判斷虛假交易,電商通過已經加入到購物車的產品,推薦相關的其他產品等。
過去幾年裡,強化學習在研究領域的出現頻率迅速提高。強化學習同樣也採用未經標記的數據,但與無監督學習不同地是,強化學習還模擬了訓練動物地過程,對進行學習的機器提供“獎懲機制”,在執行最優解時提供反饋。
和深度學習一樣地,強化學習也是通過里程碑式的突破,才引起了研究者的注意。2015年,DeepMind的AlphaGo在強化學習訓練下,成長為可以擊敗代表人類最高水平的圍棋棋手,讓埋沒數十年地強化學習再次走到大眾視線中。
而遊戲本身,也是強化學習最好的渠道——它的獎勵機制足夠明確。在機器作出了正確選擇後,它會獲得“勝利”的反饋,而這樣的反饋越多,機器越能選擇正確的策略。
下一個十年的AI趨勢
從過去二十多年的經驗來看,人工智能領域並沒有出現什麼明顯的新技術。各種技術在研究界的地位起起落落,但熱門的種種技術,許多都起源於同一時間,即上世紀50年代左右。
以神經網絡為例,它在60年代統治AI屆,80年代也有些存在感,而在2012年捲土重來之前,這一概念瀕臨滅絕。
每一個10年裡,都有不同的技術統領AI研究,華盛頓大學教授、The Master Alogrithm一書作者Pedro Domingos 稱,2020年代也不會有什麼不同,意味著深度學習的時代可能也很快就要終結。
參考資料
Karen Hao, MIT Technology Review, We analyzed 16,625 papers to figure out where AI is headed next, January 25, 2019
Geoffrey Hinton, Ilya Sutskever, Alex Krizhevsky, ImageNet Classification with Deep Convolutional Neural Networks, 2012
Isha Salian, NVIDIA blog, SuperVize Me: What’s the Difference Between Supervised, Unsupervised, Semi-Supervised and Reinforcement Learning?, August 2, 2018