微軟這麼快就集成了GPT-4,如何做到的?項目組甚至週末加班了
微軟已將OpenAI的GPT-4集成到Microsoft 365生產力應用套件中,這是一項非常艱鉅的任務,但公司一直希望能夠盡快完成。因此,微軟動員了數百名員工,讓他們長時間加班工作,一起頭腦風暴產品方案,基於一個統一的設計框架,開發出三種人工智能助手的工作模式。
以下是翻譯內容:
“3-16”
過去幾個月裡,這是在微軟的會議室和走廊裡被無數次提及的一個詞。它指的是3月16日,當天微軟宣布將與OpenAI共同開發的生成式AI模型引入Microsoft 365生產力應用套件中。通過集成GPT-4,包括Outlook、Word和Teams在內的每個生產力應用程序都將擁有基於生成式人工智能的Copilot(智能副駕駛)。目前,20多個微軟客戶正在對這項技術進行測試。
將人工智能助手集成到如此多的應用程序中是一項艱鉅的任務,但微軟希望盡快完成。去年11月,OpenAI發布的ChatGPT引發了全球轟動,掀起了一場人工智能競賽,各家企業都在爭分奪秒地推出新的人工智能產品和功能,以搶占市場先機。即使是已經與OpenAI合作和投資過的微軟也不例外
微軟設計總監喬恩·弗里德曼(Jon Friedman)負責Microsoft 365中的Copilot產品設計。他表示這個項目需要數百名微軟員工的長時間工作,包括設計師、工程師、產品經理、營銷人員、數據科學家以及道德倫理團隊等等,整個項目要持續幾個月時間,甚至需要在周末加班。弗里德曼說,這個計劃還需要人們克制自我,共同努力,才能在如此短的時間內建成如此大的項目,讓大家都感到他們必須放下自我,團結一致。
弗里德曼說:“我們可以一起做一些真正大膽而重大的事情,這讓人很興奮。雖然我們在人工智能方面擁有很多經驗,但這種特殊的生成式人工智能更強大,所以我認為每個人都在抱著學習的心態工作。”
全新的用戶體驗
弗里德曼認為,Copilot是一種“對話式用戶體驗”的新形式,它可以調用更多豐富的資源。他表示,Copilot是一款辦公助手,代表了“用戶界面設計的新前沿,就像第一代觸屏設備一樣改變既定模式”。據悉,Copilot是基於GPT-4大型語言模型開發,預訓練了大量互聯網內容,並可以訪問微軟Graph中的業務數據,從而自動生成電子郵件和會議要點等內容。
設計Copilot這種用戶界面的挑戰在於,在人們通常使用Word和Powerpoint等應用程序進行工作時,如何以及何時展示這個全新的人工智能助手。
弗里德曼表示,最初設計這種可以通過各種生產力應用程序調用的人工智能助手只是“一個模糊的想法”。但隨著設計團隊對人工智能助手在實際業務中的應用有更深入的了解,這種想法開始逐漸明確。首先,設計團隊需要發現人工智能在實際應用中可以明顯節省用戶時間或以某種方式激發創造力等具體用例,這是用戶體驗設計過程的第一步。
最了解相關用例的人包括每個生產力應用程序的工程師、產品經理、設計師和計算機科學家。弗里德曼的設計團隊與他們通力合作。在Copilot項目啟動時,他要求所有產品團隊共同頭腦風暴,探討如何利用生成式人工智能來提升生產力應用程序的功能。接著,弗里德曼成立了一個特殊的橫向設計團隊,與所有應用程序團隊合作,以在每個應用程序中展示Copilot的效果。
弗里德曼表示,隨著各個應用程序團隊開始製定用例,橫向設計團隊開始注意到這些用例之間的共性,即與多個應用程序相關的人工智能用例。
弗里德曼回憶起當時的頭腦風暴過程時說:“我們的討論非常有價值……我們討論的是Copilot具體的功能需求,例如新的生成式語言模型如何幫助我們更好地完成寫郵件摘要的任務?”
隨著跨應用用例變得越來越清晰,橫向設計團隊開始認為,每個應用程序的人工智能助手功能並不需要各自不同。
弗里德曼表示:“因為你有很多人……試著觀察各個場景,能夠大致做出這種判斷,比如說’啊,也有這個東西出現了’。”
因此,他們開始構思一個設計框架,讓一個通用助手以幾種不同的可預見方式在各個應用程序中工作。
三個層次的Copilot
弗里德曼領導的設計團隊創建了一個深度文檔庫,旨在幫助整個項目的設計師在給定的應用程序中為人工智能創建切入點。他們指導設計師根據用戶可能參與的不同任務確定如何調用Copilot。弗里德曼說:“有這樣一個觀念,Copilot應該在正確的層次出現,完成正確的工作。”
設計框架規定,Copilot在應用程序用戶界面中可以有三種展示方式。
第一種是身臨其境的用戶體驗,讓人工智能助手專注於具體業務項目,而不是某個特定的應用程序,這樣實際上可以從多個應用程序中提取數據或要點,服務於手頭的工作。例如,Copilot可能會從團隊會議、幻燈片或電子郵件內容中收集項目里程碑或風險點,然後在項目計劃文檔中進行總結和歸納。
“沉浸式”體驗模式是Copilot在生產力應用套件中最強大的功能,也可能是最有影響力的。市場諮詢公司恩德勒集團(Enderle Group)首席分析師鮑勃·恩德勒(Rob Enderle)認為,這也可能有助於解決Microsoft生產力套件長期以來存在的問題——各個應用程序之間的集成不夠緊密。恩德勒說,原因可能是最初微軟是從其他公司相繼收購這些應用程序,彼此之間並沒有共用代碼庫。但Copilot可以覆蓋到所有應用程序,至少能讓用戶感覺到這些應用程序能在某些任務中協同工作。
弗里德曼說,第二種展示方式是“輔助”,這意味著Copilot就像挎斗三輪摩托車的“邊鬥”,在特定的應用程序中幫助用戶最大限度地調用應用程序功能。例如,在PowerPoint中,Copilot可以向用戶展示應用程序的深層圖形功能如何用於描述複雜數據集;在Outlook中,Copilot可以幫助用戶理解電子郵件中最重要的內容;在Word中,Copilot可以提供有關如何更好編寫文檔、貼合特定寫作風格的反饋意見。
此外,在Copilot的“嵌入式”展示方式中,人工智能可以在應用程序中發揮生成式和創造性能力。例如,Copilot可能會出現在Word文檔的彈窗中。“這就像是一種隨機體驗。” 弗里德曼說,“當你全身心投入工作時,Copilot可以幫助你解決寫作瓶頸,或者自動用文本內容幫助你開始做幻燈片。”
弗里德曼表示,Copilot的橫向設計團隊開始採用“三個層次”的概念來描述這項工作,各個應用程序團隊的成員也逐漸接受了這個框架。
他說,“我們已經與首席執行官納德拉和公司高管團隊的其他成員分享了這個框架,並且基本上得到了所有人的認可。這種想法可以適用於三個不同的工作層次。”
Copilot這個名字不是專門為Microsoft 365而設立的。微軟旗下的GitHub在2021年曾使用這個名字來稱呼編程助手,其中部分功能也採用了OpenAI的大型語言模型。而微軟正在創建一個具有一致性的Copilot助手,能夠在不同的生產力應用套件中執行某些標準化功能。對於長期使用生產力應用程序的用戶,這項新工作很可能會減少他們在新版Microsoft 365正式推出時所遇到的生疏感。通過使用統一的助手,用戶可以更方便地使用不同的應用程序,從而提高工作效率。
隨著生成式人工智能進一步融入微軟的消費級和企業級產品,Copilot品牌和概念可能會擴展到Windows操作系統甚至LinkedIn等微軟其他產品。
“納德拉非常喜歡這個名字,因為它恰如其分地描述了人工智能助手的工作,”弗里德曼說。“它的存在是為了幫助你,在許多任務中指引你的方向……”(辰辰)