微軟和合作夥伴正在努力縮小限制訪問AI的數據沙漠
基於人工智能的工具,如計算機視覺和語音界面,有可能改變殘障人士的生活,但事實上,這些人工智能模型通常是在從這些人那裡獲得很少數據的情況下建立的。微軟正在與一些非營利性合作夥伴合作,以幫助使這些工具反映生活在失明和行動不便等情況下人們的需求和日常現實。
例如考慮一個計算機視覺系統,它可以識別物體,並能描述例如桌子上的東西。該算法有可能是用正常人收集的數據進行訓練的,坐在輪椅上的人想要做同樣的事情,可能會發現從這個較低的角度來看,系統的效果並不理想。同樣,盲人也不知道如何將攝像頭保持在正確的位置上足夠長的時間讓算法工作,所以他們必須通過試驗和錯誤來完成。在用於訓練殘疾人適用系統的面孔中,相當數量的面孔都有像呼吸機、或噴氣和吹氣控制器、或頭帶遮擋部分,如果系統從來沒有見過類似的東西,這些”混雜物”會大大影響準確率。
所以微軟今天宣布了一些由倡導組織共同主導的努力,希望對這種限制人工智能包容性的”數據沙漠”有所作為。首先是與Team Gleason合作,該組織是為了提高人們對神經運動退行性疾病肌萎縮側索硬化症(簡稱ALS)的認識而成立的。他們擔心的是上面那個關於面部識別的問題。患有ALS的人有各種各樣的症狀和輔助技術,這些都會干擾那些從未見過的算法。舉例來說,如果一家公司想要出貨依賴人臉識別的目光追踪軟件,這就成了一個問題,微軟肯定也想這麼做。
Project Insight是與微軟聯合開展的一項新工作的名稱,它將收集患有ALS的志願者用戶在開展業務時的人臉圖像。隨著時間的推移,這些人臉數據將與微軟現有的認知服務進行整合,但也會免費發布,以便其他人可以用它來改進自己的算法。他們的目標是在2021年底發布。
另一個需要改進的地方是針對視力受損或坐在輪椅上的人,需要從他們的角度來獲取數據。有兩種努力旨在解決這個問題。微軟與倫敦城市大學合作的一個項目是”盲人圖像訓練的物體識別”項目,該項目正在為使用智能手機攝像頭識別日常物體,建立一個數據集。不過與其他數據集不同的是,這將完全來源於盲人用戶。