谷歌為允許員工聆聽用戶與Assistant之間對話的錄音一事辯解
據外媒The Verge報導,谷歌正在為允許其員工(其中大多數似乎是遍布全球的合同工)聆聽用戶與其語音助手Google Assistant之間之間對話的錄音一事辯解。在比利時公共廣播公司VRT NWS披露詳細說明稱該國的谷歌合同工有時如何聽取Google Assistant在事故中捕獲的敏感音頻後,谷歌才對此事做出回應。
在周四發布的一篇博客文章中,谷歌表示,它採取預防措施來保護用戶身份,並且已經“採取了一系列保護措施來防止”所謂的錯誤接受,即當Google Assistant在Google Home揚聲器等設備上激活時沒有用戶故意用語言表達的正確喚醒詞。
該公司還表示,人類員工正在審查這些對話,以幫助Google的軟件以多種語言運行。“這是構建語音技術過程中的一個關鍵部分,對於創建Google Assistant等產品是必要的,”撰寫這篇博客文章的谷歌搜索團隊產品經理David Monsees寫道。
“我們剛剛得知其中一位語言評論員通過洩露機密的荷蘭語音頻數據違反了我們的數據安全政策,”Monsees補充道,他提及了比利時合同工與VRT NWS分享的音頻片段。“我們的安全和隱私響應團隊已經對這個問題進行關注,正在展開調查並將採取行動。我們正在對這個空間的保障措施進行全面審查,以防止這種不當行為再次發生。“
此外,谷歌聲稱只有0.2%的音頻片段由語言專家審核。“作為審查過程的一部分,音頻片段與用戶帳戶無關,並且審稿人不會轉錄背景對話或其他噪音,只會轉錄針對Google的片段,”Monsees補充道。
Google接著說,它為用戶提供了各種工具來查看Google智能助理設備存儲的音頻,包括手動刪除這些音頻片段和設置自動刪除計時器的功能。“我們一直致力於改善我們向人們解釋我們的設置和隱私實踐的方式,並將審查進一步闡明數據如何用於改進語音技術的機會,”Monsees總結道。
博客文章中沒有解決的問題是世界各地的工作人員正在審查一般自然語言改進的總體請求數量,而不僅僅是確保翻譯準確。
人工智能行業的人們普遍認為人類註釋者需要幫助理解原始人工智能培訓數據,這些工作人員受僱於亞馬遜和谷歌等公司,在那裡他們可以訪問音頻對話和文本記錄,例如用戶和智能家居設備之間的一些對話。這樣,人們可以查看交換,正確註釋數據並記錄任何錯誤,因此Google Assistant和Amazon Alexa等軟件平台可以隨著時間的推移而改進。
但亞馬遜和谷歌都沒有對此完全透明,這導致了多年來的一些爭議,這些爭議在過去幾個月裡才愈演愈烈。自從彭博社於4月份報導亞馬遜廣泛使用人類合同工來培訓Alexa以來,智能家居領域的大型科技公司不得不承擔這些產品和人工智能平台的開發、維護和改進方式。
通常這些公司的員工需要輸入數據以供基礎機器學習算法“消化”。然而他們經常在未經用戶同意的情況下完成此級別的數據收集。在亞馬遜和Alexa的情況下,即使在用戶決定刪除音頻之後,其中一些數據仍無限期存儲。谷歌的隱私控制似乎比亞馬遜更強大- 谷歌讓你完全關閉音頻數據存儲。但兩家公司現在正在爭論更廣泛的公眾如何對AI軟件進行beta測試並實時修改。
一家比利時新聞機構表示,其在合同工提供的1000個片段中發現了多達150個左右的Google Assistant錄音片段,這些片段被意外捕獲。這些員工能夠輕鬆獲取這些數據,並侵犯用戶隱私。