AI時代,重新回到“微軟敘事”
“AI 將如何重塑你的未來”,這是今年Microsoft Build 大會的主題。幾個小時前,微軟CEO 薩提亞·納德拉在微軟Build 年度開發者大會上,告訴所有人:為什麼是微軟,才能擁有如此宏大的野心——重塑所有人的未來。
微軟的Copilot 宇宙已經如預期展開|圖片來源:微軟
過去一年,背靠OpenAI 大模型優先使用權的微軟,用Copilot 掀起了「副駕駛」風潮。人們使用軟體,不再只是點擊圖形介面(GUI)圖示找功能,而是透過與AI 助理的對話,用自然語言開啟互動。透過Copilot,全球最大的軟體廠商-微軟把AI 生產力帶給使用Microsoft 365、Teams、Github 等微軟全家桶用戶的前方;
同時,微軟針對所有開發者推出了做Copilot 的工具棧-Copilot Stack,包括從底層算力到上層AI 應用工具,讓開發者做出更多軟體的Copilot 及其他AI 應用,從而帶給使用者;
21 日的Build 前瞻會上,微軟的嫡系硬體Surface 成為AI+PC 的排頭兵,踢掉英特爾、全力擁抱高通,微軟找到了AI 時代「Wintel」組合的重要夥伴。
在這場為開發者舉辦的會上,納德拉主要向開發者介紹了Copilot+PC 和Copilot stack 的一系列更新,包括Azure 雲端伺服器、模型自訂工具、模型商店、資料工具、AI 應用客製化工具等各個層面的進展。
不可或缺地,OpenAI 執行長Sam Altman 同樣在大會現身,並呼籲開發者們把握住平台變革的機會。
值得玩味的是,在去年的Build 大會上,Altman 的出現讓納德拉或多或少表現出「受寵若驚」的神態;而今年的Build 大會上,和Altman 握手的是微軟的CTO Kevin Scott——別誤會,OpenAI對微軟依然很重要,GPT-4o 依然是最好的大模型產品,但對微軟來說,它和他都已不是唯一。
對於正在將由AI 引發的新一代運算變革,逐漸拉回「微軟敘事」上,納德拉和微軟已經掌握好了節奏。
01
從Copilot到Team Copilot
相較於一年前,微軟對Copilot 的解讀有了很大變化。
微軟副總裁Charles Lamanna 在接受The Verge 採訪時解釋道:「我們很快意識到,將Copilot 限制為僅對話,極大地限制了Copilot 目前的功能。」「如果你能讓你的Copilot 更加主動,並且能夠在後台執行自動化任務,而不是讓Copilot 一直等著有人與它聊天,那會怎麼樣呢?
“2023 年微軟Copilot 專注於搜尋數據、總結內容並產生新內容,2024 年的Copilot 將非常注重可自訂。”
今天凌晨,微軟正式推出“Team Copilot”,將Copilot 從幕後的AI問答助理輔,擴展為團隊新的重要成員。微軟官方部落格概括了這一定義的轉變:「副駕駛正在從與你一起工作的副駕駛,演變為為你工作的副駕駛。」這些Copilot 將由某些事件觸發,並使用企業自己的數據。
微軟的這個定義正是半年來AI 圈火熱的智能體(agent)概念,後者可以智慧地自主執行複雜任務。
微軟展示了新版Copilot 與人群展開合作,不再是過去的一對一體驗。 Team Copilot 智慧副駕駛能夠在會議中擔任會議主持人,管理會議議程、追蹤會議時間並記錄會議要點;也可以在聊天中作為協作者,提供重要資訊、追蹤行動項目並解決未決問題。它還可以擔任專案經理,幫助確保每個專案順利推進,並及時通知團隊進行輸入。微軟計劃在今年稍後預覽Team Copilot。
Team Copilot 可以和人類使用者一起在群組中工作|圖片來源:微軟
微軟也允許企業和開發人員可以自訂自己的AI Copilot,像虛擬員工一樣工作、自動執行任務,例如能執行諸如監控電子郵件收件匣、自動執行員工任務或錄影資料等任務。
相應地,微軟推出了Microsoft Copilot Studio 及其擴展工具,讓開發者能夠根據特定任務和功能,構建主動響應數據和事件的“智能副駕駛”,同時也允許客戶通過將其連接到新的數據源和應用程式來增強Microsoft Copilot 智慧副駕駛,從而擴展其功能。
基於這類新功能的「智慧副駕駛」可透過記憶和知識了解上下文、推理操作和輸入,基於用戶反饋進行學習,並在不知道如何處理時尋求幫助,從而獨立管理複雜、長期運行的業務流程。微軟方面稱,現在從IT 設備採購到銷售和服務的客戶接待,用戶都可以讓基於Microsoft Copilot Studio 構建的智慧副駕駛為其工作。
而在消費端,微軟+高通的AI+PC 組合,結合微軟的本地小模型,正朝著終端AI 的路上狂奔。
02
微軟正在讓AI 進入現實
「我們正在經歷一次不同尋常的平台浪潮。」微軟首席技術長兼AI 執行副總裁Kevin Scott 在Build 開發者大會上如此稱。
這個所謂的平台浪潮,或許將從微軟的小模型、OpenAI 的大模型以及其他一系列AI 模型開始,以Azure 雲端運算作為管道,以微軟的AI PC 作為終端載體,延伸至所有PC 廠商的Windows 設備。
首先,微軟Azure AI 的一大產品是「模型即服務」。在Build 開發者大會上,微軟宣布,OpenAI 前幾天發布的GPT-4o 現可在Azure AI Studio 中使用,也可作為API 使用,這一多模態模型集成了文字、映像和音訊處理。
同時,微軟開發的AI 小語言模型(SLMs)Phi-3 系列,也發布了一個新的多模態模型——Phi-3-vision,有42 億參數,能夠輸入圖像和文本,並接收文本回覆.例如,使用者可以就圖表提出問題,或就特定圖像提出開放式問題。
Phi-3 家族的「小模型」主要為有限計算資源和低延遲場景的生成型AI 應用程式提供支持,可以在Azure AI 和AI 模型開源社區Hugging Face 上找到,用哪個取決於任務的複雜性和可用的運算資源,可以說是主打一個「性價比」。
這些模型可與微軟的PC 終端機結合,微軟希望開發者能夠在Windows 上建立新的AI 應用程序,為PC 設備提供差異化的AI 體驗。據稱,微軟現在有40 多個AI 模型在Windows 11 上運行。微軟高層在Build 大會上自信地稱,「Windows 是最開放的人工智慧平台」。
Phi-3 小模型的參數大小與相對品質|圖片來源:微軟
就在一天前,微軟推出了專為AI 設計的新型Windows PC,即Copilot+ PC,可實現40+ TOPS(每秒萬億次操作)。
微軟稱其“徹底重新構思了PC 的整體架構,從晶片到作業系統,從應用層到雲端,將AI置於核心地位,標誌著Windows 平台數十年來最重大的變革。”
新的架構將CPU、GPU 以及NPU 集成,可以連接到Azure 雲端中運行的大語言模型(LLM)與小語言模型(SLM)。
據微軟稱,其“AI 工作負載性能提高了20 倍”,與MacBook Air 15 英寸對比,“持續多線程性能高出多達58%”“本地視頻播放電池續航時間長20%”。
在對OpenAI 的利用上,根據微軟的說法,每台Copilot+ PC 都配有個人AI 助手,鍵盤上將有新的Copilot 鍵,在未來幾週內,用戶可以訪問包括GPT-4o 在內的最新模型,
微軟新PC 的AI 功能還包括:可以用“Recall”功能找到並記住用戶在PC 上看到的內容和做過的事情,以一條可以滾動瀏覽的時間軸和各種快照呈現;可以用“ Cocreator」在裝置上直接產生和優化AI 影像;可用「Live Captions」產生即時字幕。
微軟Copilot+ PC 的Recall 功能|微軟
其中,「Recall」的快照範圍極廣,涵蓋用戶在應用程式中做過的事情、即時會議裡的通訊、造訪過的網站等等。在隱私問題上,微軟稱,「Recall」裡的快照屬於用戶,保留在本地電腦上,用戶可以刪除單一快照,調整和刪除時間範圍,也可以選擇過濾、不保存特定應用程式和網站。
不過,據悉運行「Recall」所需的最小硬碟空間為256 GB,且必須有50 GB 的可用空間。 256 GB 裝置上Recall 的預設分配為25 GB,可儲存約3 個月的快照。
在AI 生成圖像方面,之前,微軟推出過網頁版的圖像生成工具,但可能會限制用戶可以創建的圖像數量,也存在隱私問題,Windows PC 內置“Cocreator”,透過NPU 和本地小語言模型,可以即時產生新影像,或能以電腦本地的形式緩解使用者的隱私焦慮。
據介紹,微軟也與Adobe、 DaVinci Resolve、CapCut、LiquidText、djay Pro 等合作,用戶此後可以在PC 設備上運行這些程式的AI 功能,例如在PS 影像處理、CapCut 影片剪輯中自動刪除背景。
微軟的新PC 有比先前更多的原生ARM 64 體驗,包括各種Microsoft 365 應用程序,以及Chrome 瀏覽器、Spotify、Zoom、WhatsApp、Adobe Photoshop、DaVinci Resolve 等現在都在Arm 上本地運行。
除了微軟自己的Surface,微軟與OEM 廠商宏碁、華碩、戴爾、惠普、聯想、三星等合作,Copilot+ PC 將為這些主要PC 製造商提供具有AI 功能的Windows 11 設備,搭載高通處理器,預計6 月18 日起開始供貨。
PC 將加速AI 創新,而微軟的態度是,“只有當雲端和設備協同工作時,最豐富的AI 體驗才會成為可能。”
另外,OpenAI 執行長Sam Altman 也出席了微軟的Build 開發者大會,表示模型將會變得越來越聰明,速度和成本都很重要,但最重要的是“整體智能(overall intelligence)” 。
OpenAI 的Sam Altman(左)出席對談微軟CTO |微軟
Sam Altman 對開發者的建議是,「現在可能是自行動互聯網誕生以來最令人興奮的時機,不管是做一個產品,還是創建一家新創公司,做點新東西的最大機會往往孕育於平台範式變革的時刻。
“我們已經很長時間沒見到平台範式變革了,現在看起來平台範式變革真的到來了。”
「所以,我最大的一個建議是,這是很特別的時機,把握住它。」Sam Altman 說。
此外,他還提醒,「AI 並不意味著可以輕輕鬆鬆就創造一個偉大的產品,或者一家偉大的公司,或者偉大的服務,你還是得乾活,AI 是一種加持,但單單AI 是不會自動打破一些商業規則的,你可以利用這個新東西,但你還是得找到你做的東西的價值,這是在狂熱的AI 淘金熱中很容易被忽視的。