谷歌發布音樂AI工具MusicFX:一句話就能生成一首音樂
MusicFX的出現可能顛覆音樂產業,降低音樂創作的門檻,但隨之而來的是AI生成內容對版權、所有權和如何證實音樂原創性的挑戰。 Google繼續向音樂領域發起挑戰,人人都能作曲的時代似乎又更近了一步。 12月14日,Google推出AI音樂創作工具“MusicFX”,只需幾句話,用戶即可產生原創的音樂作品。
Google在介紹中指出,這名為「MusicFX」的創作工具結合了Google先前發布的MusicLM模型和,以便在事後識別出它們是否由AI製作而成,一定程度上可以解決創作人對於版權問題的擔憂。 DeepMind的水印技術SynthID
分析認為,MusicFX的出現也將成為AI領域的一個重要里程碑,為音樂家、製作人和音樂愛好者開闢了嘗試和創作多種音樂的新可能性:
MusicFX為音樂創作者提供了豐富的音效和聲音素材,使用者可以創作各種類型的音樂,同時支援調整音調、節奏和音量,還可以添加混響、迴聲等效果。無論是想要營造舒緩的氛圍還是冒險緊張的氛圍,MusicFX都可以滿足。
MusicFX目前仍需要透過Google一個AI實驗性產品網站(AI Test Kitchen)進入,這一平台的建立是為了讓用戶在儘早體驗其最新的AI技術的同時,也能提供早期反饋,這種合作方法能幫助Google完善技術,並遵守道德標準。
媒體分析認為,MusicFX的發布不僅將為音樂生成提供全新的工具,也代表了AI發展過程中的趨勢,用戶在幫助企業完善和塑造人工智慧方面的作用變得越來越重要,透過在早期階段讓使用者參與進來,Google不僅增強了技術,還主動解決了潛在的道德問題。
此外,MusicFX的出現可能會降低音樂創作的門檻,讓更多沒有專業音樂訓練的愛好者們參與其中。
但MusicFX的出現並非沒有爭議,有觀點認為,如何解決人工智慧生成的內容對版權、所有權和音樂原創性的影響還沒有答案,Google決定在AI生成音樂中使用水印,表明了他們對這些問題的關注,但這個問題並沒有解決,AI生成的內容是否屬於原創?
對於接下來的計劃,Google表示,他們會繼續根據用戶意見繼續完善MusicFX,MusicFX有可能重新定義音樂創作及與音樂互動的方式,AI Test Kitchen可能會成為未來AI發展的典範,這種方法可以推動人工智慧發展進入負責任的新時代,在這個時代,科技與社會價值和規範並進。
MusicLM有多強大?
今年年初,GoogleMusicLM橫空出世,可以直接將文字、影像自動生成音樂,而且曲風多樣,凡是想聽的音樂,基本上都能自動生成。
MusicLM是一個以文字為條件的音訊產生模型,可以從文字描述中產生高保真度的音樂。 模型採用層次化的序列到序列的方法,這使它能夠產生幾分鐘內一致的音樂。
MusicLM使用三種模型來提取作為條件自回歸音樂產生輸入的音訊表示。 SoundStream,w2v-BERT和MuLan。
其中,AudioLM模型視覺化為MusicLM的前身,MusicLM就是利用了AudioLM的多階段自迴歸建模作為生成條件,可以透過文字描述,以24kHz的頻率產生音樂,並在幾分鐘內維持這個頻率。
相較而言,MusicLM的訓練資料更多。研究團隊引入了首個專門為文本-音樂生成任務評估數據MusicCaps來解決任務缺乏評估數據的問題。 MusicCaps由專業人士共建,涵蓋5500個音樂-文本對。基於此,Google用280000小時的音樂資料集訓練出了MusicLM。
但媒體先前分析稱,MusicLM肯定不是完美無缺的,或說離完美仍有相當的距離。有些樣本還有品質問題,雖然 MusicLM 在技術上可以產生人聲,包括完成和聲,但還有很多地方需要改進。大多數“歌詞”也是蹩腳的英語或純粹的胡言亂語,然後由合成的聲音演唱,聽起來像是奇怪的“混合物”。
AI生成音樂的版權風險:到底算不算原創?
AI跟人一樣,偶爾會偷懶直接抄襲這些素材,版權該如何保護?
Google的研究員在一次實驗中發現,該系統產生的音樂中約有1%是直接複製自其訓練的歌曲。這個問題足以讓研究人員不願意過早發布MusicLM。另外,用蒐集來的素材供AI學習,這本身是否就已經涉及到侵害著作權?
實際上目前已經有相關案例了。 2020年,美國饒舌歌手Jay-Z的唱片公司對YouTube頻道Vocal Synthesis提出版權警告,理由是它使用AI創作了Jay-Z翻唱比利·喬爾(Billy Joel)的“We Didn’t Start the Fire ”等歌曲。
美國音樂出版商協會的 Eric Sunray 撰寫的一份白皮書認為,像MusicLM這樣的AI音樂生成器透過「從訓練資料庫中吸收作品中連貫的音頻,侵犯了美國版權法的複製權」。
進一步說,AI生成的音樂雖然是“原創”,但往往像不同音樂人作品的雜糅,也就是說有洗稿甚至是山寨的嫌疑。
因而此次Google運用DeepMind的水印技術SynthID產生的ID便是對版權問題的重視,Google表示,生成的所有歌曲都帶有數位浮水印,人的耳朵聽不見也不會影響音樂的效果。主要透過音頻波轉換為二維可視化來實現。即便數位浮水印遭受了添加雜訊、音質壓縮、音訊調速等破壞性操作,仍可偵測到歌曲中的浮水印。
但有分析師指出,儘管Google加了水印證明該音樂作品是AI創作而成卻依舊沒能解決根本問題,AI系統生成的音樂到底算不算原創作品?可以和「人造音樂」同台競技嗎?
伴隨著關注與爭議,或許在不遠的未來,這些問題都將有清楚的答案。