美五大科技公司語音識別存偏見黑人誤識率比白人高

斯坦福大學的一項研究顯示，亞馬遜、蘋果、谷歌、IBM和微軟的語音識別系統存在種族差異，對白人和黑人語音的識別率有高有低。這項研究發表在《美國科學院院報》(PNAS)上，研究顯示，來自世界五大科技公司亞馬遜、蘋果、谷歌、IBM和微軟的語音識別系統，在白人用戶中出現的錯誤，要比在黑人用戶中要少得多。

研究顯示，這五大科技公司的語音識別系統在白人中錯誤識別單詞的可能性約為19%。而在黑人用戶中，錯誤率躍升至35%。此外，大約2%的白人音頻片段被這些系統認為是不可讀的。而在黑人用戶中，這一比例卻高達20%。

這項研究採用了一種異常全面的方法來衡量語音識別系統中的偏差，其結果為人工智能（AI）技術的研發敲響了警鐘。當前，AI技術正快速融入人們的日常生活中。

在此之前，已有其他一些研究表明，隨著面部識別系統被警察部門和其他政府機構所採用，在試圖識別女性和有色人種時，它們的準確性會大大降低。另有測試表明，“聊天機器人”、翻譯服務，以及其他旨在處理和模仿書面和口頭語言的系統中，都存在性別歧視和種族主義行為。

對此，紐約大學統計學教授拉維·史洛夫（Ravi Shroff）稱：“我不明白，在這些技術發布之前，這些公司為什麼沒有進行更多的盡職調查。我不明白，為什麼這些問題總是會出現。”

這項研究表明，領先的語音識別系統也可能存在缺陷，因為這些公司在培訓技術時，使用的數據並沒有盡可能的多樣化。這些系統的任務主要是從白人那裡學習，而黑人參與相對較少。

參與這項研究的斯坦福大學研究人員約翰·里克福德（John Rickford）稱：“這五家公司可能是最大的語音識別技術公司，但他們都在犯同樣的錯誤。我們原以為，這些公司很好地代表了所有種族，但事實卻並非如此。”

馬薩諸塞大學阿默斯特（Amherst）分校教授布倫丹·奧康納（Brendan O’Connor）認為，這些公司在收集數據時也存在困難，另外動力也不足。因為這些公司可能面臨“先有雞還是先有蛋”的問題。

如果他們的服務主要由白人使用，他們將難以收集可以為黑人服務的數據。如果他們在收集數據時遇到這樣的困難，這些服務將繼續主要由白人使用。但不管怎樣，華盛頓大學教授諾亞·史密斯（Noah Smith）都認為，這是一個令人擔憂的問題。

WONGCW 網誌