數學家們發現了一個無解的計算機問題
據外媒報導,數學家們發現了一個他們無法解決的,與機器學習有關的計算機問題。這並不是說他們不夠聰明,而是這個問題根本沒有答案。這個問題與機器學習有關。機器學習是一些計算機用來“學習”如何完成特定任務的人工智能模型的類型。
當Facebook或Google識別出一張你的照片,並建議你給自己貼上標籤時,它就是在使用機器學習。當自動駕駛汽車在繁忙的十字路口行駛時,這就是機器學習。神經科學家用機器學習“讀”某人的想法。機器學習的關鍵是基於數學。因此,數學家可以從理論上研究和理解它。他們可以寫出關於機器學習是如何工作的絕對證據,並在每一種情況下都加以應用。
在這種情況下,一些數學家設計了一個機器學習問題,稱為“估計最大值”或“EMX”。
要理解EMX是如何工作的,想像一下:你希望在上投放廣告,並最大限度地讓這些廣告有更大目標觀眾數量。你有向體育迷、愛貓者、汽車迷和運動愛好者等宣傳的廣告,但你不知道誰會訪問這個網站。你如何選擇一組廣告,最大限度地增加你的目標觀眾數量?EMX必須找出答案。
然後研究人員問了一個問題:EMX什麼時候能解決一個問題?
在其他機器學習問題中,數學家通常可以根據他們擁有的數據集來判斷學習問題是否能在給定的情況下得到解決。谷歌用來識別人臉的基本方法能應用於預測股市趨勢嗎?數學家不知道,但有人可能認為會。
問題是,數學有些失靈了。自從1931年邏輯學家Kurt Gdel發表了他著名的不完全性定理以來,它就被打破了。他們表明,在任何數學系統中,都有某些問題是無法解答的。不是真的很難,而是因為有些問題是不可知的。數學家們了解到,他們理解宇宙的能力從根本上說是有限的。Gdel和另一位數學家Paul Cohen找到了一個例子:連續統假說。
連續統假設是這樣的:數學家已經知道有不同大小的無窮大的數。例如,有無窮多個整數(如1、2、3、4、5等);還有無窮多的實數(其中包括1、2、3等數字,但也包括1.8和5,222.7和pi這樣的數字)。但是,即使有無窮多的整數和無窮多的實數,但顯然有比整數更多的實數。這就引出了這樣的問題:是否有比整數集更大但比實數集更小的無窮大?連續統假說認為,有。
Gdel和Cohen表明,不可能證明連續統假說是正確的,但也不可能證明它是錯誤的。“連續統假設是真的嗎?”是一個沒有答案的問題。
1月7日發表在《自然》在線期刊上一篇論文指出,EMX與連續體假說有著千絲萬縷的聯繫。
結果表明,只有在連續統假設成立的情況下,EMX才能解決問題。這意味著,“EMX能夠學會解決這個問題嗎?”這個問題的答案和連續體假設本身一樣不可知。
好消息是,連續統假設的解對大多數數學來說並不是很重要。同樣,這種永久的神秘可能也不會對機器學習造成重大障礙。
“因為EMX是機器學習中的一個新模型,我們還不知道它在真實世界算法方面的用處,”伊利諾伊大學芝加哥分校的數學教授Lev Reyzin說。在《自然》在線期刊發表的一篇文章中,Reyzin寫道:“所以這些結果可能沒有實際意義。”
Reyzin寫道,遇到一個無法解決的問題是機器學習研究人員的一大特點。Reyzin認為,這證明機器學習已經“作為一門數學學科成熟起來”。
Reyzin還說,也許像這樣的結果會讓機器學習領域保持一種謙遜。雖然機器學習算法在不斷地改變著我們周圍的世界,但是機器學習也不是萬能的。