谷歌PaLM-SayCan模型可讓機器人更好地理解自然語言並執行複雜任務
長期使用Alexa、Siri、Google Assistant 等數字助理的朋友,或許已留意到這項技術正在變得愈加智能。與此同時,近年來的機器人技術也在突飛猛進。以穀歌為例,該公司有在演示一款乒乓球機器人,旨在訓練其應對快速、自適應、且精確的任務挑戰。Google 研究員接觸科學家兼機器人技術負責人Vincent Vanhoucke 表示:“在一鳴驚人之前,你必須勤學苦練”。
(圖片來自 Haje Kamps)
在速度和精度之外,Google 還希望通過實驗,攻克人類語言和機器人技術的交叉點。截至目前,這家科技巨頭已在自然語言水平上取得了讓人印象深刻的飛躍。
舉個例子,你可能會對一個人說——“有空幫我從櫃檯拿一杯飲料嗎?”
儘管對於人類來說,這句話的語境相當簡潔。但是對於一台機器人來說,其中包含的信息量很可能將其絆倒。
因為’有空’這詞語可能不包含任何意義,也可能是趁著機器人正在幹另一件時與之通過自然語言交互。
如果機器人過度理解了字面含義,它可能會回答一句’當然可以’—— 即便用戶並未明確要求它這麼做。
若機器人更加鑽牛角尖,它可能又會陷入該幫你拿哪一種飲料的糾結。
好消息是,Google 正在使用該公司的NLP 系統拉解決一些問題。在Pathways 語言模型(PaLM)的幫助下,機器人有望更準確地接收並理解人類的真實所想。
下一階段的挑戰,則是審視機器人能夠切實做到哪些事情。比如讓你讓機器人拾取冰箱頂部的一瓶清潔劑時,它是否會小心安全地擺放到兒童不易接觸到的地方。
不過在此之前,Google 還是會著眼於更加普適性的任務。簡單的有’向前移動一米’,稍微高級點的可以是’去廚房拿一罐可樂’。
然後才是複雜多步任務的拆解執行,比如——’啊哦,我不小心將可樂撒地板上了!能幫忙清理乾淨、並再給我拿一杯嗎?’
對此,Google 選擇的方案是利用語言“講述”(Say)模型中所包含的知識,來幫助機器人確定並評估哪些高級指令“可否”(Can)派上用場。
在融匯了PaLM 語言模型之後,Google 已將它重命名為PaLM-SayCan,且正在自家實驗室使用來自Everyday Robots 的一些機器人(上圖展示其已學會何時去充電休息)。
當然,在投入實際商用之前,這項技術顯然還有相當多需要完善的地方,尤其是需要事先收集極其龐大的知識與技能數據集。