聊天機器人遇到不懂的還能上網搜索像極了不懂裝懂時偷偷百度的我

聊天機器人一直是人工智障的代表。儘管從GPT-3開始，AI生成的文本已經能做到以假亂真，但這僅限於生成一段話。在連續聊天中，AI不會記得自己之前說過的話，就像下面這樣：

AI這種前後矛盾的表現，在人類看來就是沒有穩定的身份和個性，好像聊著聊著換人了，也難怪一直被當作人工智障。

現在，Facebook AI團隊終於推出BlenderBot2.0，在1.0基礎上添加了長期記憶和即時搜索功能。

首先要記住自己說過的話：

記下自己說過的“我喜歡很多種音樂”，和“Kanye West是我最喜歡的說唱歌手”這樣的信息，避免後續聊天中出現矛盾。

人類說的話也要記住，比如最喜歡的專輯：

最後，如果人類提到了AI不知道的東西怎麼辦？

趁沒人發現悄悄去網上搜索，還能把搜出來的信息顯擺出來：

查到對方喜歡的藝人Beyonce的出生地，並用“我去過那裡幾次”接上對話。

是不是像極了在群裡聊天吹水時偷偷百度的你？

如何告別智障

Facebook AI去年發布的BlenderBot1.0就已經做到了94億參數，在單輪對話生成上取得了出色的效果。

這次升級的重點是一個檢索增強算法，能從過去對話記憶和互聯網上的資料中提取出能用在當前對話的信息。

對於訓練數據，Facebook在眾包平台上發布了任務。

讓參與者在對話中扮演一個特定的人格，並隔幾小時、隔幾天對同一個話題進行討論，收集成多輪對話數據集。

AI從網上搜索資料並用於聊天的能力，也是從人類那裡學來的。

同樣是在眾包平台上，這次的任務是讓一個人描述自己的興趣開啟話題，另一個人可以上網搜索並接上對話。

這樣AI不僅能學到人類在面對不同話題的適合搜索什麼關鍵詞，還能學到最後什麼樣的信息可以用在聊天上。

實驗結果上，BlenderBot2.0對之前對話內容的使用率提高了55%，在對話中的事實一致性提高了12%，而人類評估員打出的分數提高了17%。

能上網搜索信息還讓AI能夠參與人類世界中最新的話題，比如談論新上映的電視劇。

如果和BlenderBot1.0聊起今年新片《旺達幻視》，他只能說我沒看過，這天就聊死了。

Blender2.0就可以搜索後說出片中最喜歡的角色是誰，讓人更有把對話繼續下去的慾望。

AI的記憶不再靜止於它完成訓練的那一刻。

LeCun點贊，馬斯克擔憂它的三觀

三巨頭之一的LeCun第一時間轉發了BlenderBot2.0並評價為“首個能對任意話題Hold住多輪對話的聊天機器人”

馬斯克所擔心的，是AI從開放互聯網上獲取信息很快會變得三觀不正。

他舉的例子是微軟推出的Tay機器人在16小時左右就被網友聊成了納粹支持者，最後被迫下架。

對於和AI討論“最喜歡的作品”這回事，有人表現出了不信任：

AI不會喜歡某個作品，只是自動把最流行的作品當成最好的，和網上追逐熱點的大多數人一樣。

有人看出了潛在的隱私風險：

你們說讓AI上網搜索，不會是在Facebook上搜索我發的帖子吧。

如果你感興趣，可以到Facebook的Parlai平台下載模型和它聊聊看。

WONGCW 網誌