微軟小冰首席科學家:我們其實想讓小冰更像人
近日在微軟小冰年度研究進展分享會上,微軟小冰三大首席科學家分享了小冰近期的技術突破,包括唱歌、會比喻等。2019年8月15日,微軟正式推出了第七代小冰。微軟小冰首席NLP科學家武威認為,Self-Complete(自我完備)可以很好地概括近些年來微軟在小冰身上的研究成果。
一個能夠自我完備的對話機器人應該擁有幾項能力:學習、自主管理、連結。
“我認為這三項能力貫穿起來就構成了一條縱線,貫穿了對話機器人這些年來,甚至可能是未來一段時間整個的研究與發展。” 武威表示,其實還有一條橫線,橫線就是微軟小冰核心對話引擎的進化。小冰一開始做檢索模型,通過重用已有的人類的對話來實現人機交互,後來團隊又做生成模型,讓小冰自己能夠去合成回复,再到後來做共感模型,希望小冰能夠自主的去把握整個的對話流程。
“這條橫線和那條縱線實際上交錯在一起,構成了一幅對話機器人發展的絢爛畫卷。”
其中,學習包括能夠從人類的對話中學習怎樣說話,以及機器人之間互相學習。
武威透露,團隊今年嘗試了讓兩個機器人通過互相學習來共同進步。即讓兩個檢索模型在訓練過程中互為師生,互相交流。在每一次迭代的時候,一個模型都把它從數據中學到的知識傳達給另外一個模型,同時又從另外一個模型中接觸到它的知識,然後這兩個模型互相學習,最終希望能夠得到共同的進步。
微軟小冰首席語音科學家欒劍提到了小冰唱歌技術的進展。他透露,小冰是從2016年開始做唱歌的,之後經過努力,小冰在語音合成領域一些大的問題已經被解決了,團隊就開始尋找一個更有挑戰性的課題繼續來做,所以就選擇了唱歌。
選擇唱歌主要有三個原因:唱歌的門檻比說話高,在技術上有難點;情感表達上更加豐富激烈一些,歌曲是一種喜聞樂見的形式;它是一個很重要的娛樂形式,唱歌做好了,應該是很有市場前景、很有方向的。
深度學習其中一個很重要的支撐就是數據,現在有大數據的支持才能夠把深度學習做的這麼好。而“對唱歌這個任務來說,數據其實是比較困難的,因為相對於說話來說,清唱的數據是非常少,絕大部分的數據是混雜的、伴奏的音軌。”欒劍表示,團隊曾經和唱片公司進行合作,利用了其數據庫中已有的混合了伴奏的數據進行很好的學習。
據悉,小冰唱歌也有一定的商業化前景,比如其日本分身已經與唱片公司簽約。
欒劍總結認為,接下來不管是人工智能創造,還是唱歌提高上,都要兩條腿走路,一邊要不斷提高模型,一邊要不斷挖據更多的數據,這兩個東西如果做的更好,質量會不斷得到提高。
小冰目前除了寫詩、會畫畫、會作曲、會唱歌,今年另一個進展是可以創造比喻。微軟小冰首席科學家宋睿華表示,希望小冰真正創造出人類不曾說過的比喻,而不是在人類已有的文章裡去挖掘這種比喻句,不要用“像”、“就像”、“一樣”這樣子的模板把它挖掘出來。
為了幫助小冰學會“比喻”這項技能,宋睿華透露,他們從復雜的詩歌中挑選了6大類,每類122個主題,並通過小冰聊天日誌過濾出了包括愛情、內心、世界、母親、美麗、人類在內的96個常用比喻概念。隨後從1000個常用詞中選取了3000個最常用的形容詞擴充小冰的比喻能力。
比如愛情與國足,它們共同的相關詞彙可能有未來、虛幻,那麼小冰就可以作出“愛情就像國足,未來都是虛幻的”這樣自然的比喻句。
“我們其實想讓小冰更像人,你會發現除了工作,聽音樂是你很大的一個享受。我覺得人跟動物的不同在於有一定的自主性,人工智能創造體現了一種自主性,包括作曲、寫詩、畫畫,我們做算法的人也不知道最後會產生什麼樣的結果,你在那一瞬間就會有一個錯覺,覺得她有意識,這是非常好的一個點。”宋睿華表示。