兩年時間過去微軟這個應用離盲人“看到”世界又了進一步
2016 年4 月,微軟向全世界展示了一個特殊的眼鏡。它外表看上去平淡無奇,但內置了攝像頭與麥克風。當有人戴上它時,只需輕輕觸摸,眼鏡內置的攝像頭就會捕捉面前的畫面,並通過AI 系統分析後告訴用戶這是什麼,無論是周圍的環境、物體還是人的表情,用戶都能立即知曉。
這項技術的核心者是一位叫薩基博·薩科(Saqib Shaikh)的微軟員工,他是一位盲人。薩科相信AI技術的可能性,於是他嘗試開發了這樣一副眼鏡,並將其稱為Seeing AI。2017年,微軟基於薩科和團隊的研究,推出了一款移動應用Seeing AI,讓薩科的願望在每個人的手機上更進一步實現。
如同當年那個神奇的眼鏡一樣,Seeing AI 這款應用能藉助AI 技術來分析周圍的物體,通過手機鏡頭捕捉到的文字、條形碼、圖像等直接「口述」出來傳達給用戶,讓他們得以「看到」周圍世界。我們也在App 發布後帶來過第一時間體驗。如今,兩年時間過去,3 月12 日微軟大幅更新了這款應用,這一次它離「看見」的目標又進了一步,極客之選也第一時間下載下來體驗了一番。
更豐富的體驗
和兩年前相比,Seeing AI 最大的變化在於功能的進一步完善(但依然不支持中文)。在原來支持人物、短文、文本、條形碼和場景識別的基礎上,如今的Seeing AI 還加入了顏色(Color)、手寫體(Handwriting)、光線(Light)的識別功能,這些功能對盲人朋友來說不但實用,而且也易於上手。
顏色功能是通過手機的後置攝像頭來捕捉畫面當中出現的顏色,並直接用語音傳達給用戶,它的處理速度很快,因為這一功能相比場景識別更簡單。不過顏色識別和場景識別的作用並不一樣,比如當盲人朋友買衣服或者鞋子的時候,這個簡單的功能其實非常有用。
手寫體識別的功能則接近於之前的文本識別,但細分出來可以更好識別出某人手寫的信件或者菜單之類的圖像信息,很遺憾經過嘗試,手寫體也同樣識別不出中文語言,但對英文和阿拉伯數字識別準確率已經非常高,可以滿足日常使用。
光線這個功能比較特殊,在攝像頭捕捉到明暗程度不同的畫面時,它會通過高低不同的聲音(聽起來類似蜂鳴)來表示當前場景的光線強度,這個功能我想像不出具體使用場景,但對於盲人使用者來說,或許也會在一些特定場合起到作用(比如晚上睡覺關燈?)。
不僅僅是這樣的細分功能嘗試,Seeing AI 本次更新還有一大亮點,它終於支持瀏覽手機相冊了。盲人群體雖然看不見世界,但他們也會用手機拍照,或者保存一些有美好回憶的照片在自己相冊,新的Seeing AI 可以直接打開每一張照片,給手機前的用戶講出每張照片的內容,並且告訴他們照片拍攝時間、地點,這不得不說是非常貼心的功能。
技術擺脫黑暗
利用AI 技術來幫助弱勢群體這件事,微軟似乎做過很多嘗試。
比如我們曾經介紹過的能幫助帕金森病人更好寫作和吃飯的智能手環,以及能幫助“漸凍症”患者進行輸入的眼球追踪,這些看起來和普通人距離較遠的技術,在有的公司看來或許並沒有多少經濟價值,但對很多弱勢群體來說卻是能徹底改變生活的技術。
也正是這個原因,作為微軟工程師,同時也是一位盲人,薩科才會不斷將Seeing AI 這樣的技術努力開發出來,他明白對於盲人來說可以“看到”世界是一個多大的誘惑,而在一步步的推進中,此次Seeing AI 的更新,更進一步實現了很多人想像當中的“看見世界”的願望。
AI 技術的更多可能性在被我們發掘,現在的手機正在一步步變成很多人的眼睛,也許它未來還將會代替一些人的耳朵,或者代替一些人的雙腿,也許,正因為那些社會中的“不同聲音”的存在,我們才能發現技術的更多可能性。不過目前,Seeing AI 這款應用只能在美區App Store 下載且只支持英文,但或許不久的將來,我們能看到更多語言版本的Seeing AI 出現幫助身邊這群特殊的用戶。(編輯:Rubberso)