微軟推出了AI Dev Gallery 讓Windows 11本機運行AI模型變得更容易
Copilot+ PC 是首款在裝置上執行小語言模型(SLM) 的電腦。 這種方法的優點在於,它比基於雲端的Copilot 應用程式更快地產生圖像或文字生成等任務的結果。 現在,微軟推出了AI Dev Gallery,這是一種將設備上的人工智慧功能整合到任何應用程式中的簡單方法。
AI Dev Gallery 應用程式適用於希望嘗試多種模型將人工智慧功能整合到其應用程式中的開發人員。 該應用程式提供超過25 個樣本,用戶可以下載並在裝置上運行。 此外還可以將專案或原始程式碼直接匯出到應用程式中,並立即運行。 它適用於Windows 10 和11,同時支援x64 和ARM64 架構。
目前,唯一存取它的方法是在Visual Studio 中建置項目,然後執行它。 此外,還需要至少20GB 的空間和多核心CPU。 它還建議配備8GB VRAM 的GPU。
此應用程式有兩種模式: 樣本和模型,程式將它們分為文字、圖像、程式碼、音訊和視訊以及智慧型控制。
測試模型
影像生成和影片生成的模型相當大,接近5GB。 我們從一個與升頻有關的小模型開始,它不到100 MB。 我們截取了一張螢幕截圖,並嘗試使用CPU 進行縮放,工作時可以在CPU 和GPU 之間切換處理請求。
在這個配置較低的虛擬機器中,縮放過程不到30 秒,記憶體消耗瞬間攀升至1GB。 應用程式展示的是解析度為9272*4900 的升頻版影像。 圖像元素,尤其是文字受到嚴重影響,難以辨認。
沒有在更大視窗或全螢幕預覽生成影像的選項。 甚至連將其保存到磁碟的下載選項也沒有
我們嘗試了另一個名為Detect Human Pose 的模型。 它可以識別圖像中某人的位置。 雖然它能準確地識別一個基本上行走的人,但它甚至開始為我們打開了幾個應用程式的桌面截圖顯示位置標記。
我們不知道這些模型如何整合到應用程式中,但其中一些功能可以在本地運行。 當然,這些機型的PC 需要更大的儲存空間,以及配備16GB 或更大記憶體的強大CPU。
是否值得下載一個5GB 的模型來將文字提示轉換成圖片,或者等待30 秒來在網頁應用程式上實現這一功能?顯然,這些功能大多有非常小眾的用例和實作環境,而不是吸引整個Windows 11 用戶群。