Google的下一代人工智慧模式Gemini 1.5已基本準備就緒
Google希望其大型語言模型”雙子座”(Gemini)能將其帶入人工智慧產業的頂端,而在推出”雙子座”僅兩個月後,Google就宣布了其後續版本。Google今天發布了Gemini 1.5 版,並向開發者和企業用戶提供,很快就會向消費者全面推廣。該公司已明確表示,它將全力把Gemini 打造成一個商業工具、個人助理,以及介於兩者之間的所有工具,而且它正在大力推進這一計劃。
Gemini 1.5 有許多改進:Gemini 1.5 Pro(Google系統中的通用型號)與該公司最近才推出的高階Gemini Ultra 能力不相上下,而且在87% 的基準測試中,它都優於Gemini 1.0 Pro。它採用了一種越來越常見的技術,即”專家混合”(MoE),這意味著當你發送查詢時,它只運行整個模型的一部分,而不是一直處理整個模型。這種方法能讓使用者更快使用模型,也能讓Google 更有效率地運行模型。
但是,Gemini 1.5 中的一個新功能讓整個公司都特別興奮:Gemini 1.5 有一個巨大的上下文窗口,這意味著它可以處理更大的查詢,一次查看更多的資訊。這個視窗高達100 萬個tokens,而OpenAI 的GPT-4 為12.8 萬個,目前的Gemini Pro 為3.2 萬個。”這大約相當於是10 或11 個小時的視頻,數萬行代碼”。上下文視窗意味著可以一次向人工智慧機器人詢問所有內容。
Google CEO皮查伊也表示,研究人員正在測試一個1000 tokens的上下文窗口–這就好比是將《權力的遊戲》的整個系列同時播出,或者把整個《指環王》三部曲都放進這個上下文視窗中。
這允許在查詢時添加大量個人上下文和信息,就像我們極大地擴展了查詢視窗一樣。
目前,Gemini 1.5 只能透過Google的頂點人工智慧(Vertex AI)和人工智慧工作室(AI Studio)提供給企業用戶和開發人員。最終,它將取代Gemini 1.0,而Gemini專業版的標準版本–每個人都可以在gemini.google.com和公司的App中使用的版本將是1.5 專業版,擁有128000 個tokens的上下文窗口,而需要支付額外的費用才能獲得百萬級的權限。Google也正在測試該模式的安全性和道德底線,尤其是新增加的上下文視窗。
當全球企業都在試圖制定自己的人工智慧策略–以及是與OpenAI、Google或其他公司簽署開發者協議時,Google正在為打造最好的人工智慧工具而展開一場激烈的競賽。就在本週,OpenAI 公佈了ChatGPT的”記憶能力”,同時似乎準備進軍網路搜尋領域。到目前為止,Gemini 似乎給人留下了深刻印象,尤其是對於已經進入Google生態系統的人來說,但各方都還有很多工作要做。
最終,所有這些1.0、1.5、Pro、Ultras 和企業之爭對用戶來說並不重要。人們將只需要感受AI,這就像使用智慧型手機,而不必總是關注手機裡面的處理器是怎麼運作的。