碾壓GPT-4 谷歌DeepMind CEO自曝下一代大模型將與AlphaGo合體
谷歌DeepMind CEO Hassabis全新爆料:全新Gemini模型將結合進AlphaGo和大語言模型,成本預計是數千萬美元,甚至數億。谷歌,是真的破釜沉舟了。傳說中合併了AlphaGo和類GPT-4大模型的Gemini,終於要來了嗎?
一個是用強化學習擊敗人類圍棋冠軍、創造歷史的AI系統,一個是目前霸榜幾乎所有大模型榜單、一騎絕塵的最強多模態大模型,兩個AI一合體,簡直要無敵了!
GoogleDeepMind CEO Hassabis近日對外媒Wired表示,Gemini還在開發中,還需要幾個月,而GoogleDeepMind已經準備砸進數千萬美元,甚至數億。
此前,Sam Altman曾透露,創建GPT-4的成本超過了1億美元。Google DeepMind,當然也不能輸。
太長不看版
Gemini會將AlphaGo與GPT-4等大模型的語言功能合併,系統解決問題和規劃的能力將大大增強。
- Gemini是一個大語言模型,類似於GPT-4
- 預計花費數千萬到數億美元,與開發GPT-4的成本相當
- 除了AlphaGo,還會有別的創新
Gemini會整合使用了強化學習和樹搜索的AlphaGO。
- 強化學習允許AI通過從反复嘗試和反饋中學習,解決挑戰性難題
- 樹搜索方法有助於探索和記住場景中可能的移動,比如在遊戲場景中
DeepMind在強化學習方面的豐富經驗,會為Gemini帶來嶄新功能。
- 其他領域技術(如機器人和神經科學)也會整合到Gemini中
下一個算法,要超越ChatGPT
根據OpenAI CEO Sam Altman的說法,GPT-5距離發布尚有時日,至少6個月內不會開始訓練。而Gemini的發佈時間尚未確定,可能在幾個月之內。
尚在開發中的Gemini,也是一個處理文本的大語言模型,性質上和GPT-4類似。
但GoogleDeepMind CEO Demis Hassabis表示,Gemini會結合進AlphaGo中使用的技術,這將賦予系統全新的規劃、解決問題的能力。
2016年,AlphaGo擊敗圍棋世界冠軍李世石的那一幕,如今依然歷歷在目。
Hassabis表示,“可以這麼說,Gemini把AlphaGo系統的一些優勢,和大語言模型驚人的語言能力結合在一起了。並且,我們還有一些其他有趣的創新。”
據說,Gemini具有以前模型中沒有的多模態功能,在集成工具和API方面非常高效。而且,Gemini將提供多種規模,旨在支持未來內存和規劃上的創新。
在三月份,曾經有這樣一個說法:Gemini會像GPT-4一樣,具有一萬億個參數。而且,據說Gemini將使用數以萬計的GoogleTPU AI芯片進行訓練。
在上個月的Google開發者I/O大會上,Google就曾提到,從一開始,Gemini的目標就是多模態、高效集成工具、API。
而當時Google的預告是:“雖然還在早期,但我們已經在Gemini中,看到了在之前的模型中從未見過的多模態能力,這讓人印象太深刻了。”
AlphaGo背後的技術,就是強化學習,這是DeepMind首創的技術。
RL代理隨著時間的推移與環境交互,通過反複試驗來學習策略,從而最大限度地提高長期累積獎勵
通過強化學習,AI能夠通過反复嘗試和接受反饋來調整自己的表現,因而學會處理很棘手的問題,比如在圍棋或電子遊戲中選擇如何採取下一步行動。
另外,AlphaGo還使用了蒙特卡洛樹搜索(MCTS)方法,來探索和記住棋盤上所有可能的動作。
這已經不是Hassabis第一次攪動起科技巨頭的大規模人工智能淘金熱了。
2014年,DeepMind使用強化學習,讓AI學會了玩簡單的視頻遊戲,這一成果驚為天人,直接讓DeepMind被Google收購。
Google的注果然押對了。
接下來幾年,DeepMind隔一段時間就產出一個驚艷全世界的成果。
深度學習和強化學習正在解決許多經典的人工智能問題,例如邏輯、推理和知識表示
2016年,石破天驚的AlphaGo,直接點燃了深度學習和第一輪AI產業的熱潮。
2017年,AlphaGo Zero沒有使用人類數據,就迅速超越了AlphaGo。
AlphaGo Zero
2020年,AlphaFold對於蛋白質結構的預測與實驗室技術相當,基本解決了蛋白質的折疊問題。
今年6月,AlphaDev創造全新的排序算法,或將徹底改變計算機科學的效率和成果。
相比OpenAI更通用的路線,DeepMind多年來深耕垂直領域。
語言模型的下一個重大飛躍在哪裡?Gemini或許指引了下一代語言模型的方向。
背水一戰
很明顯,Gemini是Google的背水一戰。
Google開創的許多技術,比如Transformer架構,讓最近的AI洪流成為可能。
因為對於技術的開發和部署太過謹慎,在ChatGPT和其他生成式AI構成的競爭面前,它反而顯得暫時落後。
為了對打ChatGPT,Google連續拋出多個動作,比如推出Bard,並且將生成式AI集成到搜索引擎和其他產品中。
為了集中力量辦大事,在4月,Google乾脆把Hassabis的DeepMind和Google的主要人工智能實驗室Google大腦合併,合體為GoogleDeepMind。
對於合體後的全新團隊,Haasabis顯然非常自信。他表示,全新的團隊匯集了兩股對最近的人工智能進步至關重要的力量。
“如果你看看我們在人工領域的位置,你會相信,未來80%或90%的創新,就會來自其中一個團隊。在過去十年裡,兩個團隊都做出了極其出色的成果。”
新的想法
訓練像OpenAI的GPT-4這樣的大型語言模型,需要將來自書籍、網頁和其他來源的大量精選數據集的輸入“Transformer”中。
Transformer使用訓練數據中的模式來熟練預測後續文本中應該出現的每一個字母和單詞。
這種看似簡單的機制,卻在回答問題和生成文本或代碼方面非常強大。
但這個看似簡單的技術原理也被很多行業大佬或者人工智能專家們詬病。
馬斯克:目前AI技術的本質就是統計學
LeCun:現在的AI的智能水平還不如狗
OpenAI在GPT系列模型上的突破,就是在Transformer的核心技術之上,很激進地採用了RLHF來強化模型的能力。
而DeepMind在強化學習方面同樣有非常豐富的經驗。
這就讓人有非常充足的理由期待Gemini在未來可能會展現出來的創新能力。
更加關鍵的是,Hassabis和他的團隊也會試圖用人工智能其他領域的核心技術來增強大型語言模型的能力。
DeepMind的技術積累非常廣泛。
從機器人技術到到神經科學,他們武器庫裡有各種各樣的裝備可供他們挑選。
比如像LeCun這樣的AI大佬就表示,Transformer將語言模型的能力過度限制在了文本的範圍之內。
像人類和動物⼀樣,從世界的物理經驗中學習可能才是發展人工智能的最優解。
也許在Gemini身上,人工智能將展示出其他方向的潛力。
不確定的未來
Hassabis的任務是加速Google的人工智能技術的發展,同時管理未知和潛在的嚴重的風險險。
大語言模型的飛速進步讓許多人工智能專家開始擔心這項技術是否會打開潘多拉的魔盒,讓人類社會付出無法接受的代價。
Hassabis表示,人工智能可能給人類社會帶來的收益不可估量。
人類必須要持續發展這項技術。
強制暫停發展AI技術完全沒有可操作性。
但是這並不意味著Hassabis和他領導的DeepMind會不計後果地推進技術的發展。
畢竟,Google和DeepMind之所以把AI技術的領袖位置拱手讓給OpenAI。
很大一部分原因就是對待AI發展採用了“過於負責任”的態度。
網友:不看好
但是對於未來Gemini的發布,因為考慮到之前Google保守的態度,大部分網友似乎都不太看好。
你們覺得這個類似於AGI的模型會在什麼時候發布呢?
我賭10塊Google永遠不會發布這個東西。
如果有人關注過Google的項目的話,就會發現,他們一般都是先吹一陣牛,然後什麼也不發布,一年後再把這個項目給砍了。
不過,對於Google在目前大語言模型中做的貢獻,網友還是很認可的。
網友A:OpenAI用的大語言模型技術基本都是Google發明的
網友B:是的,不過特斯拉發不了財,但是愛迪生可以。
這位網友就很看好DeepMind將利用自己在強化學習方面的經驗能在大語言模型上產生的突破。
不過他依然認為可能Google只會用改進自己現有產品的思路來推進這個技術,而不是推出全新的產品。