微軟發10項新品:28.5萬個核心的AI超算機,最大語言模型
昨晚,一年一度的微軟Build開發者大會拉開序幕。與往常不一樣的是,大會的舞台從往年的美國西雅圖搬到了線上,同時發布的新產品和新升級也幾乎面向開發者,成為開發者們的“獨家盛宴”。毫不意外,今晚大會仍以微軟現任CEO薩蒂亞·納德拉(Satya Nadella)的主題演講作為開場。在短短的20多分鐘演講中,“開發者”、“Azure”、“Microsoft 365”和“Windows”等關鍵詞貫穿全場,尤其是“開發者”。
看點:微軟砸10億美元扶持的超算來了,一文看盡昨夜Build大會十大看點!
他談到,目前GitHub上的開發者已超過5000萬人,Power Platform上的開發者也超過了350萬人。而微軟也將為開發者提供一系列提高工作效率的開發工具和解決方案,進一步提升生產力。
圍繞開發者,本次微軟Build大會的核心亮點如下:
1、宣布與OpenAI合作開發的AI超級計算機,專門用於訓練大規模分佈式AI模型。
2、推出面向醫療行業的Microsoft Cloud for Healthcare,提升醫療護理團隊的協作、決策和操作效率。
3、推出針對工業系統的AI開發平台Project Bonsai,以及Project Moab實驗平台。
4、推出Windows開發者平台Project Reunion,統一UWP和Win32的現有API。
5、升級DeepSpeed庫,主要面向深度學習領域,並開源史上最大語言模型——微軟圖靈模型。
6、發布Azure Synapse Link,可對實時運營數據進行分析。
7、WSL 2新增特性,包括對GPU、Linux GUI應用程序的支持,以及簡化安裝體驗。
8、推出Microsoft Teams平台功能更新,包括為開發人員提供流線型體驗。
9、開源併升級Fluid Framework,提供Fluid組件和Fluid工作區。
10、提供負責任的機器學習工具,以減少不公平性。
除此之外,微軟推出命令行界面Windows Package Manager,幫助開發者快速搜索、查看和安裝各類管理工具。同時,微軟Chromic內核的瀏覽器Edge也新增了側邊欄搜索、同步等新功能。
值得一提的是,微軟還宣布收購機器人流程自動化(RPA)創企Softomotive,以將RPA技術引入Power Automate。
AI超級計算機亮相,針對大規模分佈式AI模型訓練
2019年7月,微軟宣布向人工智能研究實驗室OpenAI投資10億美元,以共同構建一個新的Azure AI超算平台,將主要用於訓練和運行更加先進的AI模型,其中包括基於微軟Azure AI超算技術。同時,這筆投資也將進一步幫助OpenAI開發AGI(通用人工智能)技術。
歷時一年,這台超級計算機終於在今晚亮相,主要用於大規模分佈式AI模型訓練。
微軟聲稱,這台超級計算機的性能位列全球前五,共包含28.5萬個CPU核心和1萬個GPU,每個GPU網絡帶寬為400Gb/s。
由於在Azure中託管,這台超級計算機已經能夠實現一系列現代云基礎架構的功能,包括快速部署、可持續的數據中心,以及對所有Azure服務進行訪問。
經研究人員實驗,該超級計算機已經能夠實現大規模AI模型訓練,可深入了解語言語法、知識概念和上下文內容的細微差別。同時,它還可以總結冗長的對話、在實時遊戲中進行適度對話、解析複雜的法律文件,甚至通過搜索GitHub生成代碼。
目前,微軟已使用圖靈模型來改善Bing、Office、Dynamics和其他生產力產品的語言理解功能。例如,在Bing中,該模型生成文字和回答問題的速度提高了125%。
微軟表示,其將通過Azure AI服務和GitHub,進一步將大規模AI模型、訓練優化工具和超級計算機資源釋放出來,讓開發者、數據科學家和商業客戶都能輕鬆利用AI的力量。
Microsoft Cloud for Healthcare:提升醫療護理效率
在微軟看來,今年新型冠狀病毒疫情的大流行幾乎影響了人們生活的方方面面,同時也阻礙了醫療保健業務的正常運行,大大降低了患者治療和護理的效率。
針對這一問題,推出了其首個針對特定行業的雲產品——Microsoft Cloud for Healthcare,支持微軟Teams中的新Bookings應用程序,護理人員能夠在Teams中安排、管理和進行患者的虛擬就診,並提供相應服務,進一步增強患者溝通、護理團隊的協作和管理效率。
與此同時,用戶還可以使用Microsoft Cloud for Healthcare來擴展Microsoft Dynamics 365 Marketing、Dynamics 365客戶服務和Azure IoT價值,以進行患者體驗、醫生轉診管理、患者檢測等部署。
其中,基於Microsoft Cloud for Healthcare擴展的Microsoft Healthcare Bot服務,自今年3月以來已有超1600個COVID-19機器人實例投入使用,服務了23個國家的3100萬人,進一步減輕相關疾病預防控制中心的緊急熱線壓力。
工業系統AI開發平台Project Bonsai
簡單地說,Project Bonsai是一個用於構建自主工業控制系統的AI平台,也是一項“機器教學”服務,它結合機器學習、校準和優化功能,能夠為製造、化工、建築、能源和採礦等行業機械的核心控制系統提自主化,以更好地管理各類工業設備。
Project Bonsai通用強化學習平台能夠協調AI模型的開發,為AI模型的部署和訓練提供了針對算法和基礎設施的訪問,允許模型在本地、設備或云上部署,並支持MATLAB Simulink、Transys、Gazebo和AnyLogic等模擬器。
此外,用戶能夠在Project Bonsai的儀錶盤上查看所有工作和訓練狀態,對模型進行調試、檢查和改進。同時,Project Bonsai還支持多用戶協作構建和部署新模型。
與此同時,針對想要嘗試Project Bonsai的工程師和開發者,微軟還開發了一款名為Project Moab的硬件設備。
它是一個具有三個手臂、一個操縱桿控制器的機器人,能夠讓一顆小球在頂部的透明板上保持平衡。該工具為用戶提供了一個模擬環境,讓用戶借助模擬器進行實驗。
Project Reunion:統一Windows應用生態平台
微軟此次推出Windows開發者平台Project Reunion,主要目的就是在於統一Windows的應用生態平台,通過融合Universal Windows Platform(UWP)和Win32的現有API,讓開發者能夠擺脫不同操作系統之間的限制,輕鬆實現跨平台開發。
微軟將在兩者間添加更多通用的API和可互操作代碼。這將為應用程序提供一個通用平台,幫助用戶使用最新功能更新,以及現代化現有應用程序,無論是C++、.NET(包括WPF、Windows Forms、UWP),還是React Native。
此外,微軟還面向企業用戶推出了Windows Terminal 1.0,能夠讓用戶在多個選項卡和窗格中運行任何命令行可執行文件,包括WSL發行版和Azure Cloud Shell。
DeepSpeed庫升級,微軟圖靈模型開源
早在今年2月,微軟發布了DeepSpeed的開源版本,並同步推出了ZeRO(零冗餘優化器)。
DeepSpeed主要為跨多台服務器進行分佈式模型訓練而設計,ZeRO是一種將大型模型擬合到內存中的技術,通過減少數據並行中的內存冗餘以實現結果。
ZeRO-1包含模型狀態內存優化,ZeRO-2則提供了激活內存和碎片內存的優化。同時,ZeRO-2還針對單個GPU上的訓練模型進行了改進。據悉,ZeRO-2訓練模型的速度比谷歌BERT提升30%。
微軟表示,ZeRO的內存優化技術能夠訓練具有170億個參數的機器學習模型,如擁有170個參數的微軟圖靈模型,它是目前世界上最大的語言AI模型,主要用於自然語言生成(NLG )。
值得一提的是,微軟宣布將在短期內開源微軟圖靈模型,以及在Azure機器學習中訓練它們的方法。DeepSpeed庫的升級,也將讓開發者能夠使用ZeRO-2來訓練大型神經網絡。
Azure Synapse Link:可對實時運營數據進行分析
Azure Synapse Link能夠讓用戶通過Azure Synapse Analytics中的實時操作數據,直接獲得分析結果,無需進行提取、轉換或加載步驟。同時,它還能將實時數據與現有的分析存儲庫結合,以獲得相關業務的整體視圖。
此外,Azure Synapse Link可以在SQL行的指導下以“PB級”速度查詢數據,具有智能工作負載管理和並發功能,可以實時優化查詢性能。
在安全性方面,Azure Synapse Link具有自動威脅檢測和始終在線數據加密功能,具備動態數據屏蔽、細粒度訪問控制和列級/行級安全性。
據悉,Azure Synapse Link最初將在Azure Cosmos DB中發布,但很快就會應用到所有的操作系統中,進一步幫助開發者降低成本並減少時間。
WSL 2新增對GPU、Linux GUI應用程序的支持
WSL 2新增幾項特性,包括對GPU、Linux GUI應用程序的支持,以及簡化安裝體驗。
一方面,WSL 2支持GPU計算工作流,使Linux工具能夠利用GPU為一系列開發場景進行硬件加速,例如並行計算、訓練AI和機器學習模型。該功能將在今年下半年正式更新。
另一方面,WSL 2將支持Linux GUI應用程序,允許用戶在打開一個WSL實例時直接運行Linux GUI應用程序,無需第三方服務器。
今年晚些時候,WSL 2將支持簡化安裝體驗。屆時,開發者能夠簡單地運行“wsl.exe -install”命令並重新啟動。
Microsoft Teams平台功能
在疫情期間,Microsoft 365核心組件Microsoft Team智能會議平台的使用量出現了大幅度的增長。
今年4月,Satya Na DELL a談到,Microsoft Team的單日參會量已超過2億,產生了超過41億分鐘的會議記錄。此外,目前Teams每天有超過7500萬活躍用戶,其中有三分之二的用戶在Teams上進行文件共享、協作或交互。
因此,微軟針對線上會議的龐大需求,對Microsoft Teams進行一系列功能更新,其中包括擴展Visual Studio和Visual Studio Code,讓開發者能使用自己熟悉的工具對Teams應用進行開發;提供Power Virtual Agents bot ,消除在Teams中使用Power Virtual Agents bot時,用戶重複登錄的需要等。
開源併升級Fluid Framework
2019年,微軟推出了協作平台Fluid Framework,它能幫助用戶更好地進行協作,並增強共享互動體驗。
在今晚的大會上,微軟宣布將開源Fluid Framework,同時還針對其協作形式進行一系列升級,主要體現在Outlook和Office.com中。
一方面,用戶可以在網頁版Outlook中插入圖表、任務列表等,使用戶的銷售數據、項目任務和研究報導等資料保持實時更新;
另一方面,用戶可創建和管理Fluid工作區,如文檔活動源和推薦列表,或在office.com中進行搜索。由於Fluid Framework組建是輕量級的,因此用戶可即時編輯。
提供負責任的機器學習工具
微軟人工智能平台副總裁埃里克·博伊德(Eric Boyd)曾指出,如今越來越多的開發人員都被要求構建一個易於解釋,且符合非歧視和隱私法規的AI系統。
基於此,微軟決定在Azure機器學習和OSS工具包中發布負責任的機器學習工具,通過改善模型的可解釋性來減少不公平性,並確保數據隱私和機密性,進一步幫助開發者更負責任地部署AI模型。
一方面,它通過將Fairlearn與Azure機器學習結合使用,讓開發者和數據科學家可利用專門的算法來確保每個人都擁有更公平的結果。
另一方面,它通過將新的WhiteNoise差異隱私工具包與Azure機器學習結合,讓數據科學團隊能夠構建機器學習解決方案,在保護隱私的同時防止個人數據的重新標識。
此外,為了實現安全的模型訓練和部署,Azure機器學習還提供數據和網絡保護功能。其中,包括對Azure虛擬網絡的支持、用於連接機器學習工作區的專用鏈接,以及客戶管理密鑰等。
結語:一場面向開發者的技術盛宴
從今晚微軟Build大會的發布看,微軟越來越重視開發者的體驗,在為開發者提供越來越便捷和豐富的開發工具時,也更強調他們身上所擔起的責任和義務。
其中,微軟與OpenAI合作開發的AI超級計算機面世、首次面向專業領域推出的Azure服務、針對工業系統的AI開發平台Project Bonsai、UWP和Win32的統一,以及微軟圖靈模型等重磅產品推出和升級,無疑展現了微軟與開發者之間的彼此依賴、彼此賦能。
隨著全球各行各業的數字化轉型熱潮鋪開,微軟又將如何在這個過程中進一步探索自己與開發者、與AI技術、與產業之間的合作與未來?時間會告訴我們答案。