AI還會寫歌?研究報告AI可依據歌詞生成旋律
從歌詞中生成音符序列可能聽起來像是科幻小說的內容,但人工智能可能會把這變成普遍的現實。日前,在Arxiv.org 上發表的一篇論文中,來自東京國立信息學研究所的研究人員描述了一種能夠從已學習音節和音符關係產生“歌詞調節”旋律的機器學習系統。
“來自歌詞的旋律生成一直是人工智能和音樂領域的一個具有挑戰性的研究問題,它能夠學習和發現有趣的歌詞和伴奏旋律之間的潛在關係。”該論文的共同作者寫道,“隨著現有歌詞和旋律數據集的發展以及AI,歌詞和旋律之間的音樂知識挖掘逐漸成為可能。”
正如研究人員解釋的那樣,音符有兩個音樂屬性:音高和持續時間。音高是聲音的感知屬性,其在頻率相關音階上通過高度或低度來組織音樂;而持續時間表示音調或音調被發聲的時間長度。
研究人員的AI 系統使用對齊數據與長短期記憶(LSTM)網絡結。LSTM 網絡是一種能夠學習長期依賴性的遞歸神經網絡,經過訓練,可以在音節和單詞級別學習聯合嵌入數學表示來捕捉歌詞的突出結構,隨著時間的推移就能學會在給出歌詞的同時預測旋律,同時考慮到歌詞和旋律之間的關係。
為了訓練它,該團隊編制了又12,197 個MIDI 文件組成的數據集,每個文件都配有歌詞和旋律對齊。在將語料庫分成訓練、驗證和測試並將它們嵌入模型之後,研究者進行了一系列測試以確定它預測的旋律與歌詞、MIDI、音符持續時間和休息持續時間順序對齊的程度。他們報告稱,他們所用的人工智能係統不僅“在各個方面”都超越了基線模型,而且與人類音樂的分佈非常接近。
研究人員寫道:“音樂和人工智能中歌詞的旋律生成仍然未得到很好的探索。利用深度學習技術製作旋律是一個非常有趣的研究領域,旨在了解和輔助人類的音樂創作活動。”
如果該研究未來能夠有所進展,人工智能可能很快就會成為音樂家們的寶貴工具。今年7 月,總部位於蒙特利爾的創業公司Landr 籌集2600 萬美元用於開發分析音樂風格的產品,以創建定制的音頻處理器,而今年早些時候,OpenAI 和谷歌推出了利用音樂生成算法的在線創作工具。最近,索尼的研究人員研究了特定條件下的kick-drum 軌道生成的機器學習模型。讓AI 從事作曲甚至更廣泛的音樂工作,似乎很快就不屬於天方夜譚。