速度再漲10倍解讀谷歌語音助手的全面進化
想要了解谷歌智能語音助手Google Assistant的潛力,最好的方法之一就是看看其現在能多快地打開碧昂斯(Beyonce)的Instagram頁面。谷歌項目經理梅吉·霍倫格(Meggie Hollenger)通過“Hey, Google”這個短語喚醒了其智能手機上的谷歌助手,然後開始了測試,連續快速地發出12個指令。
霍倫格的指令包括:“打開《紐約時報》、打開YouTube、打開Netflix、打開日曆、設置5分鐘的計時器、今天天氣怎麼樣?明天呢?顯示約翰·傳奇(John Legend)的Twitter更新、顯示碧昂斯的Instagram更新、打開手電筒、關掉手電筒、預定Uber網約車到我所在的酒店。”
伴隨著霍倫格的每個指令,手機就會彈出相應新的信息,整個過程耗時41秒。她不需要在命令之間重複喚醒Google Assistant的短語。當她要求查看碧昂絲在做什麼時,Google Assistant不僅會啟動Instagram應用程序,還會自動把我們帶到這位流行歌手的頁面,這樣你就能看到她與1.27億粉絲分享的最新照片。同樣地,當霍倫格要求使用Uber時,該軟件已經知道她當前位置。
在谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)向世界推出其人工智能驅動的智能虛擬助理三年後,谷歌於美國當地時間週二的年度I/O開發者大會上預展了這款助理的“下一代升級”。GoogleAssistant現在可以比以前快10倍的速度提供答案。速度的大幅提升可能有助於扭轉人們對語音助手過於遲緩和不准確的看法。如果像谷歌和亞馬遜等公司想讓這些數字助手進一步成為主流,這將是一件大事。
對於這家全球最大,每年提供超過1萬億次搜索答案的搜索服務公司來說,讓Google Assistant獲得成功至關重要。許多人不再通過在電腦上打字來查詢信息,而是通過智能手機和智能音箱來交談。谷歌現在正與亞馬遜及其Alexa、蘋果及其Siri展開競爭,以給我們帶來我們越來越希望從始終連網設備中得到的即時滿足。
為此,在年度I/O開發者大會幾天前,谷歌邀請資深科技記者理查德·內瓦(Richard Nieva)前往其加州山景城(Mountain View)全球總部,首先瀏覽下其迄今為止對Google Assistant進行的最大升級,此舉堪稱“成敗在此一搏”。升級後的GoogleAssistant很吸引人,但也有點兒嚇人。
下一代數字助手成為谷歌推出諸多新功能中的焦點,這些功能展示了谷歌世界級的人工智能和工程能力。Google Assistant不僅速度更快,而且更加智能化,谷歌繼續依靠過去五年在神經網絡研究和語音識別方面取得的突破,將自己與競爭對手區分開來。
此外,GoogleAssistant越來越個人化。你將能夠將家庭成員添加到親密聯繫人列表中。例如,當你向Google Assistant問路想去你媽媽家的時候,它知道你媽媽是誰,住在哪裡。去年推出的語音禮賓服務Duplex也有一個新功能,可以讓Google Assistant在你口頭提出租車或購買電影票等要求後,自動在網上填寫表格。
Google Assistant產品副總裁曼努埃爾·布朗斯坦(Manuel Bronstein)表示:“我們可能會看到這樣的全新世界,即與系統實際通話的速度要比打電話快得多。如果這種情況成為現實,或當這種情況發生時,你會看到更多的人參與進來。”
Google Assistant產品副總裁曼努埃爾·布朗斯坦希望讓語音搜索比打電話更快
但所有這些都凸顯出這樣的事實,即谷歌已經擁有了全球數十億人的海量數據。該公司還強調稱需要收集更多的個人信息,才能將Google Assistant的真正願景變為現實。目前,Google Assistant已在10億部設備上被使用,主要是因為它預裝在運行全球最流行移動操作系統安卓(Android)的手機上。
此外,谷歌的許多其他服務,比如Gmail、YouTube、地圖和Chrome瀏覽器,每月也為超過10億人提供服務。所有這些服務都是有用的和創新的,但它們的命脈是你每天通過搜索歷史、電子郵件收件箱、視頻瀏覽習慣和駕駛方向向該公司提供的數據。
當然,這一切都需要以GoogleAssistant真正發揮作用為前提。谷歌不允許內瓦及其同事親自體驗其語音助手,也不允許他們錄製演示視頻。相反,谷歌為他們提供了預先拍攝的營銷視頻。霍倫格還根據預先編寫的命令備忘單讀取腳本。因此,在手機和智能家居設備上執行普通人漫不經心的請求時,目前還無法知道這款軟件的靈活性有多強。
值得注意的是,演示過程中也出現了一些錯誤。雖然從一個應用程序跳轉到另一個應用程序非常快,但霍倫格不得不重複一兩次查詢,因為Google Assistant在第一次嘗試時沒有處理她的請求。不過,在其他演示中,霍倫格使用Google Assistant以極高的準確度口述文本和電子郵件。該系統還能分辨出她想要在電子郵件中寫什麼,以及什麼是通用命令。例如,當她說“發送它”時,GoogleAssistant就會發送電子郵件,而不是在電子郵件正文中鍵入“發送它”這樣的字眼兒。
不過,GoogleAssistant肯定會成為討論的主題,或許還會引發爭議。阿斯彭科技政策中心(Aspen Tech Policy Hub)主任貝琪·庫珀(Betsy Cooper)表示:“這其中有積極的一面,也有消極的一面,還有利弊權衡。有了Google Assistant,因為它總是處於傾聽狀態(捕捉喚醒短語),它有可能會濫用這種特權。”
打造個性化谷歌
谷歌首席科學家弗蘭西斯科·比菲斯(Francoise Beaufays)表示,新的Google Assistant是他們五年辛勤工作的碩果,這比該軟件問世的時間還長。在這五年中,谷歌研究人員在人工智能音頻、語音、語言識別和語音控制方面取得了關鍵進展。比菲斯稱:“我們所做的是徹底改造整個堆棧,使用一個神經網絡來做所有的事情。”
這是一項重大的技術突破,將所需的空間從100GB降低到不足0.5GB。不過,這款升級版的數字助手需要智能手機具備強大的計算能力,因此只能在高端設備上使用。谷歌將在其旗艦手機Pixel的下一個高端版本上推出這款產品,預計Pixel將於今年秋季推出。
在2016年5月推出Google Assistant的幾天前,內瓦和皮查伊在他那間玻璃牆的辦公室裡坐了下來,聆聽後者的推介。這家搜索巨頭在數字語音助手領域已經落後多年,現在終於準備好與Siri和Alexa展開競爭。對於谷歌來說,Google Assistant就是要突破公司標誌性的白色主頁,把它的工程學智慧滲透到你所擁有的每一項技術中——手機、汽車甚至洗衣機中。
皮查伊當時稱:“這是谷歌在問用戶:’嗨。我能幫什麼忙?’把它想像成建立你自己的谷歌。”現在,皮查伊為Google Assistant開啟了一個新階段,包括了解你家庭具體細節的功能,且比以往任何時候都更清楚地表明,當他說“打造個性化谷歌”時,他是認真的。谷歌不會讓皮查伊接受采訪。
時代變化
當然,現在的世界與三年前大不相同。
首先,谷歌與亞馬遜的競爭如今已經是一場全面競爭。市場研究公司eMarketer的數據顯示,在智能音箱方面,亞馬遜的Alexa Echo設備佔據了近67%的市場份額,而由Google Assistant驅動的Google Home佔比近30%。谷歌今天發布了Nest Hub Max,這是一款內置Google Assistant的10英寸智能顯示屏。
然後是關於隱私和安全的公開辯論。在社交網絡巨頭Facebook的劍橋分析公司(Cambridge Analytica)濫用數據醜聞發生之後,立法者和消費者對大型科技公司的政策更加關注,並將數據收集問題推到了風口浪尖上。就在上個月,谷歌還因為其Sensorvault數據庫而受到批評,該數據庫可以根據谷歌對你個人信息的了解,幫助衡量其利潤豐厚的定向廣告的有效性。
事實證明,全美各地的警察部門在試圖破解犯罪調查時,都曾利用Sensorvault獲取位置數據。作為回應,美國眾議院下屬的一個委員會致信皮查伊,要求就數據庫問題給出答案。議員們要求在5月10日前舉行一次現場簡報會。
谷歌首席科學家弗蘭西斯科·比菲斯表示,新一代Google Assistant背後的研究可以追溯到5年前
上週,谷歌被問及:如果執法部門要求谷歌提供家庭關係數據和Google Assistant收集的其他信息時,谷歌會怎麼做?Google Assistant產品副總裁布朗斯坦表示,谷歌在為廣告目的存儲數據方面一直存在“非常好的爭論”。他說,公司的理念是“不要為了存儲信息而存儲信息,而是要為能帶來價值而存儲。我們希望所有這些事情都能保持透明,這樣你就能知道什麼時候這些信息被用來做廣告,或者永遠不會被用於廣告。”
但隱私專家表示,谷歌應該更好地向消費者傳達其政策。斯坦福大學互聯網與社會中心消費者隱私主管珍·金(Jen King)說:“我不知道人們實際上對此理解得有多透徹。”她補充說,谷歌應該給人們更多的選擇,讓他們選擇是否參與數據收集,而不是把事情混為一談。
谷歌在如何處理透明度方面已經受到挑戰。去年,美聯社報導稱,谷歌甚至在人們關掉智能手機上的位置共享功能後,仍能追踪他們的位置。這些數據是通過名為“位置歷史”的谷歌地圖功能存儲的,這與Sensorvault數據庫中的功能相同。美國公民自由聯盟(ACLU)等批評人士表示,谷歌披露的信息並不誠實。該公司後來在其網站上修改了此前的幫助頁面,以澄清設置是如何工作的。上週,谷歌宣布了一項功能,允許人們自動刪除位置、網頁和應用程序歷史。
布朗斯坦還表示,如果用戶在設置中允許的話,來自Google Assistant的“一小部分”語音查詢將與穀歌的一個團隊共享,該團隊致力於改進人工智能係統。他沒有提供任何關於“被分享語音記錄有多小”的細節。但他說,在這些情況下,個人信息被從語音音頻中剝離。
Duplex 的演化
除了GoogleAssistant帶來速度上的震撼外,谷歌還在更新去年引發最大爭議的項目——Duplex。該功能使用聽起來令人不安的人工智能軟件,代表Google Assistant用戶打電話進行服務預訂和預約。它的人工智能可以模仿人類的語言,使用像“uh”和“um”這樣的口頭語。它說話的節奏就像真人一樣,在回答問題前停頓一下,拉長某些單詞發音,好像是在爭取時間思考。
去年的演示立即為人工智能倫理學家、行業觀察人士和消費者敲響了警鐘,他們擔心這款機器人具有欺騙人類的能力。谷歌后來表示,它將增加信息披露,這樣人們就會知道他們在與自動軟件對話。這次新的迭代要溫和得多。
谷歌Duplex獲得升級,增加了許多新功能
谷歌週二更新了Duplex功能,以簡化租車和購買電影票等更多類型預訂的流程。但這一次沒有說話聽起來像人類的機器人,它基本上自動完成了你在移動網絡上可以找到的表單填寫過程。你可以這樣說:“Hey Google,下次旅程為我從National租車公司租輛車。”然後,Google Assistant會在你的手機上打開National的網站,開始實時填寫這些字段。
在整個過程中,你將看到一個進度條,就像下載文件時看到的那樣。當Duplex需要更多信息時,比如價格或座位選擇,進程會暫停並提示你進行選擇。填好表格後,點擊確認預訂或付款即可。與其他Google Assistant功能一樣,該系統使用從日曆、Gmail收件箱和Chrome自動填充(包括信用卡信息)中挑選的數據來填寫表單。今年晚些時候,這一更新將在安卓手機上推出。
Google Assistant工程主管斯科特·霍夫曼(Scott Huffman)今年早些時候曾說過,儘管這一版本可能會造成較少的反沖,但去年廣泛的爭議對谷歌來說是一個關鍵時刻。他說:“人們的反應強度讓我吃驚,這讓我們清楚地看到,這些社會問題未來會有多麼重要。”
Google Assistant也有其他的事情要處理。谷歌週二還推出了一款新的安卓手機“駕駛模式”。當你激活它時,用戶界面會將一些你可能在開車時使用的項目放在前面和中間位置。這些功能包括谷歌地圖、Waze導航導航、音樂控制以及來電提醒等。當你啟動導航功能後,音樂或電話控制就會出現在屏幕的底部,這樣你就不用擺弄手機來找它們了。
道路規則
總的來說,谷歌的新智能助手公告可能會對我們如何使用科技產品和服務產生重大影響。讓語音命令變得更簡單、快捷,可能會改變我們與設備的互動方式,就像十多年前以蘋果iPhone為首的智能手機成為主流,並引發觸摸屏時代到來一樣。也許我們可以把這看作是邁向人類不斷與無生命物體對話世界的第一步。
Google Assistant的“駕駛模式”突出導航和音樂功能
谷歌下一代GoogleAssistant還可以為培養語音查詢的新習慣打下基礎。去年,谷歌宣布了語音命令的“繼續對話”功能,它可以在用戶提出問題後將麥克風打開8秒鐘,這樣用戶就可以繼續提問。下一代Google Assistant已經基於這一概念改進,最終可能為擺脫喚醒短語開闢一條道路。
這種開放式麥克風可能會引發對隱私的擔憂。布朗斯坦說,把麥克風打開一段時間是有幫助的(公司還在調整這段時間的長短),但他希望人們在說話時“能保持相關意識”。他說:“你不一定想讓這個東西把你說的話都抄錄下來,因為你會覺得不舒服。”
谷歌還有許多其他方式可以提升GoogleAssistant。霍夫曼今年早些時候曾說,他有興趣讓這款軟件記住你昨天和它進行的一次確切討論,這樣今天你就可以從你們上次討論的地方繼續。他甚至希望Google Assistant能夠檢測你的情緒和語調。
不管這是否令人恐懼,這就是谷歌如何考慮改進Google Assistant的方式。不過,布朗斯坦表示,目前他的重點是讓用戶體驗變得更加無縫,並在添加這些面向未來的功能之前弄清楚哪些功能對用戶更有價值。
與此同時,人們將不得不解決大規模數據收集和比以往任何時候都要聰明的技術所帶來的各種問題,谷歌知道這一點。正如霍夫曼早些時候所說的那樣:“有了人工智能,我們最終會讓社會思考一些道路規則。”