Mozilla Firefox將利用AI提高瀏覽器的無障礙瀏覽能力
現在,似乎每一款現代軟體都配備了人工智慧,為客戶提供品質、實用性和安全性都值得懷疑的功能。 Mozilla 及其Firefox 瀏覽器也未能拒絕人工智慧的廣泛應用,該公司希望透過人工智慧實現更好的可訪問性。
在最近Mozilla Hacks 上的一篇文章中,Tarek ZIade 解釋了Firefox瀏覽器將如何利用人工智慧來提高可訪問性,即為依賴螢幕閱讀器等輔助技術的用戶提供人工智慧生成的圖片說明。
圖片說明或”alt 文本”為讀者提供了必要的背景信息,但遺憾的是,許多作者忽略了alt 文本,導致近一半的圖片缺少適當的描述。隨著最新人工智慧技術的發展,現在可以運行本地機器學習模型來自動產生標題,而無需向伺服器發送潛在的敏感資訊。
Firefox 130 將在”nightly頻道”中為PDF 編輯器提供一項新功能,使用基於Transformer 的小型開源機器學習模型產生alt 文字。 Mozilla 聲稱,這些模型在描述圖片方面表現出色,而且無需耗費大量資源。因此,Firefox 使用者即使在效能較弱的裝置上也能獲得影像描述(首先在PDF 中)。
博文稱,小型模型可以產生包含2 億多個參數的alt 文本,同時佔用不到200MB 的磁碟空間,並能在幾秒鐘內提供輸出。與最新的GPT-4o 等現代LLM 的”巨無霸”相比,它們的細節和準確性都要遜色一些,但開發人員並不想用過多的信息來淹沒用戶。
因此,Firefox 將重點放在製作類似這樣的一句話描述上:
一群人在辦公室慶祝生日,前景是一個點燃的生日蛋糕,背景是一位微笑的女士。
使用本地模型有幾個好處。除了提高隱私性(圖像不會被處理到任何地方),使用者還能獲得更好的資源效率、更高的透明度、更少的二氧化碳排放(訓練大型模型會產生大量碳排放),以及定期增強的頻繁更新。
更多技術信息,請參閱官方文件。