借助機器學習Edge瀏覽器現可自動生成圖片描述

今年年初，適用於Windows 10/11 系統的Microsoft Edge 瀏覽器引入了基於人工智能和機器學習的文本預測功能。而今天發布的公告中，微軟宣布借助機器學習算法提供自動生成的圖像標籤。這項功能將會給視力障礙患者帶來幫助，減少由於沒有圖片註釋而帶來的差距。

對於視力障礙患者來說，上網瀏覽網頁時往往需要藉助屏幕閱讀器。然而，這樣做的挑戰是，如果網絡上的圖像沒有替代文本，屏幕閱讀器就不可能解釋圖像並給出準確的描述。

有鑑於此，微軟Edge 想出了一個變通的辦法，即圖像的自動生成的替代文本。它的主要目的是通過幫助屏幕閱讀器解釋所顯示的圖像的含義和意義，來提高屏幕閱讀器的用戶體驗。

你所需要做的就是為屏幕閱讀器打開從微軟獲取圖像描述的功能來訪問這個功能。然而，在描述時，算法可能並不准確，而且可能有所不同。一旦你打開這個按鈕，未標記的圖像將被自動發送到Azure 認知服務的計算機視覺API，以便由Microsoft Edge處理。

在處理過程中，視覺API會分析並創建5種不同語言的圖像描述。此外，它還能夠識別超過120種不同語言的圖像中的替代文本。

然而，這個系統有一些局限性，即它可能無法處理某些圖像的描述，例如。

● 被網站作者標記為”裝飾性”的圖像。裝飾性圖片對網站的內容或意義沒有貢獻。
● 小於50×50像素的圖像（圖標大小和更小的）。
● 過大的圖像
● 被Vision API歸類為色情性質、血腥或有性暗示的圖像。

用戶可以通過一個名為AccessibilityImageLabelsEnabled的企業策略設置來控制這一功能，你可以禁用它。它目前適用於Windows、Mac和Linux用戶。目前還沒有跡象表明它何時會應用於Android和iOS用戶。

WONGCW 網誌