AI也能作曲!OpenAI神經網絡能生成任何流派音樂
本站智能訊5月14日,據外媒報道,人工智能(AI)技術生成的音樂會給人以非常奇妙的體驗,這其中有兩個原因:第一,這是個非常吸引人的全新領域;第二,我們真的不知道它會走向何方。然而,AI技術實際上在音樂和商業上的應用都很有趣。
由諸多硅谷大亨聯合建立的AI非營利組織OpenAI,通過平克·弗洛伊德(Pink Floyd)、埃拉·菲茨傑拉德(Ella Fitzgerald)、2Pac等風格的歌曲創作,揭示了AI在音樂領域的全新應用,結果令人驚歎。只是,有時候這些曲目聽起來很像許多流行音樂的醉酒卡拉OK版本。
OpenAI最近剛剛發佈了音樂生成系統Jukebox,並在博客文章和論文中詳細介紹了該系統。該組織網站上稱,Jukebox是個神經網絡系統,可以生成各種流派和藝術家風格的原始音頻。
OpenAI還發布了Jukebox背後的代碼,以及一個用於探索生成音樂示例的工具。該組織承諾提供12分鐘的閱讀時間和10天的收聽時間。這是一筆不錯的交易。
Jukebox背後的科學非常有趣。爲了實現上述目標,研究人員使用原始音頻來訓練模型,作爲回報,模型也會生成原始音頻。爲了讓該系統發揮作用,研究人員首先使用卷積神經網絡對原始音頻進行編碼和壓縮。
在那之後,他們使用所謂的變壓器來生成新的壓縮音頻,然後對其進行上採樣,將其轉換回原始音頻。通過這樣的做法,神經網絡會生成以前不存在的新歌曲。
通過流派、藝術家和歌詞作爲輸入,Jukebox能夠輸出從零開始創作的新音樂樣本。舉例來說,如果你選擇了經典曲目《Never Gonna Give You Up》,Jukebox就會試圖不斷地生成更多類似風格的歌曲。
通過Jukebox Sample Explorer,我們可以瀏覽來自衆多藝術家的近8000首生成的曲目,這其中包括器樂和歌詞。如果有人已經聽厭了自己最喜歡的藝術家的所有歌曲,這對我們來說可能是一座新的“金礦”。
OpenAI團隊繼續致力於根據不同類型的啓動信息,如MIDI文件和STEM文件來生成音頻樣本。通過這種方式,他們認爲自己將能夠讓音樂家對未來幾代人有更大影響力。這可能是一次會永遠改變音樂文化的嘗試。 (小小)