微軟研究人員為電子表格應用開發了專用人工智慧LLM
微軟的Copilot 生成式人工智慧助理現已成為該公司許多軟體應用程式的一部分。其中包括Excel 電子表格應用程序,用戶可以在其中輸入文字提示來幫助處理某些選項。微軟的一群研究人員一直在研究一種新的人工智慧大型語言模型,這種模型是專門為Excel、Google Sheets 等電子表格程式開發的。
這些微軟團隊成員最近在Arxiv.org 網站上發表了他們關於這個新模型的研究論文,這個模型的名字相當平淡無奇,叫做SpreadsheetLLM。
研究人員在論文中指出,電子表格包括具有大量不同形式和選項的佈局和格式。研究人員稱,這可能會為標準人工樂虎國際手機版下載帶來一些問題,例如在理解單元格位址和格式等電子表格特定功能方面的令牌限制。
團隊表示,他們的SpreadsheetLLM 就是為了克服這些挑戰而設計的。此外,該團隊還開發了所謂的SheetCompressor,顧名思義,它實際上是對電子表格進行壓縮,以便SpreadsheetLLM 能夠更有效地使用電子表格。
文件指出:
它由三個模組組成:基於結構錨的壓縮、反向索引轉換和資料格式感知聚合。它大大提高了電子表格表格檢測任務的效能,在GPT4 的上下文學習設定中,比vanilla 方法高出25.6%。
在他們的實驗中,微軟的研究人員能夠利用較大的電子表格提供更好的結果,同時將詞元成本降低了96%。
目前還不知道微軟計畫何時甚至是否向大眾提供SpreadsheetLLM。論文指出,這種模型仍有一些限制,包括如果電子表格使用任何背景顏色和邊框,因為它們可能會佔用過多的標記。此外,SheetCompressor 目前還不能壓縮包含自然語言的儲存格。
論文指出:
例如,將”中國”、”美國”和”法國”等術語歸類到”國家”等統一標籤下,不僅能提高壓縮率,還能加深LLM 對資料的語意理解。
微軟能否將這項研究成果轉化為實際產品,讓我們拭目以待。
了解更多: