最強開源大模型亮相:開發2個月花費約1000萬美元
企業軟體公司Databricks宣布推出了新的開源人工智慧模型DBRX,聲稱這項模型在開源人工智慧領域的效率和性能上樹立了新的行業標準。 Databricks宣稱,DBRX模型擁有1320億個參數,在語言理解、程式設計和數學技能等關鍵領域的基準測試中,其性能超過了其他領先的開源人工智慧模型,包括Meta的Llama 2-70B和法國新創企業Mixtral AI的模型。
雖然DBRX在某些原始功能上還無法與OpenAI的GPT-4相比,但Databricks高層表示,DBRX無疑是一個功能遠超GPT-3.5的替代產品,而且成本只是GPT-3.5的一小部分。
Databricks的執行長 Ali Ghodsi 在新聞發布會上表示:「我們非常高興能向全世界展示DBRX,並帶動整個產業朝著更強大、更有效率的開源人工智慧方向前進。雖然GPT-4這類基礎模型無疑是極為優秀的通用工具,但Databricks專注於為客戶量身打造模型,這些模型能深入解析他們的專有資料。DBRX的發布正體現了我們實現該目標的決心。 」
創新的「專家混合」架構
Databricks的研究團隊揭示了DBRX模型的關鍵創新之處—「專家混合」架構。這項架構使DBRX與其他競爭模型顯著不同,後者往往利用所有參數來產生每個單字。相較而言,DBRX巧妙地整合了16個專家子模型,並在即時處理中為每個token準確挑選最相關的四個子模型。
這種設計的巧妙之處在於,它使DBRX在任何時刻只需啟動360億個參數,因而實現了更高的效能輸出。這不僅顯著提高了模型的處理速度,還大幅降低了運行成本,使其更有效率和經濟。
這項創新策略是基於Mosaic團隊在早期Mega-MoE專案上的進一步研究而開發的。 Mosaic團隊是去年被Databricks收購的一個研究部門。
戈德西高度評價了Mosaic團隊的貢獻,他表示:「多年來,Mosaic團隊在更有效率訓練基礎人工智慧模型方面取得了顯著進步。正是他們的努力讓我們能夠迅速開發出如DBRX這般卓越的人工智慧模型。實際上,開發DBRX只花了約兩個月時間,成本大概在1000萬美元左右。”
推進Databricks的企業AI策略
透過將DBRX開源,Databricks的目標不僅是在前沿人工智慧研究領域確立其領導者地位,而且還希望促進其創新架構在整個產業中更廣泛的採用。此外,DBRX也致力於支援Databricks的核心業務——為客戶客製化並託管基於其專有資料集的人工智慧模型。
在現今的市場環境中,許多Databricks的客戶都依賴OpenAI及其他供應商提供的GPT-3.5等模型來支撐其業務運作。然而,將敏感的企業資料託管給第三方,常常激起關於安全性和合規性的一系列擔憂。
針對這一點,戈德西表示:「我們的客戶相信,Databricks能夠妥善處理跨國界資料監管的問題。他們已在Databricks平台上儲存並管理了龐大資料量。現在,有了DBRX以及Mosaic的客製化模型功能,客戶們能夠在保障資料安全的同時,充分利用先進人工智慧技術帶來的諸多益處。”
在日益激烈的競爭中佔有一席之地
隨著DBRX的推出,Databricks在核心資料和人工智慧平台業務領域面臨激烈的競爭。競爭對手諸如資料倉儲巨頭Snowflake已透過推出自有的人工智慧服務Cortex,複製了Databricks的部分功能。同時,亞馬遜、微軟和谷歌等領先的雲端運算服務供應商也正紛紛在其技術堆疊中整合生成式人工智慧功能。
Databricks借助其開創性的開源專案DBRX,自詡具備最前沿的人工智慧研究能力,旨在確立自身作為該領域領導者的地位,並吸引頂尖的數據科學人才。這項策略也反映了人們對大型科技公司將人工智慧模型商業化的越來越多的抵制,許多人批評這些商業模型像“黑盒子”,缺乏透明度和可解釋性。
DBRX面臨的真正挑戰在於市場的接受程度以及它為Databricks客戶所創造的具體價值。在企業越來越多尋求利用人工智慧推動業務成長和創新的同時,也要保持對自有數據的控制,Databricks賭注於其尖端研究與企業級平台的完美融合能夠讓它在競爭中脫穎而出。
Databricks向大型科技公司及開源社群的競爭對手拋出了挑戰,要求他們在創新上與其一較高下。人工智慧領域的競爭日趨激烈,而Databricks已明確宣布其志在成為這場競爭的關鍵力量。