AI也能作曲！OpenAI神經網絡能生成任何流派音樂

本站智能訊5月14日，據外媒報道，人工智能（AI）技術生成的音樂會給人以非常奇妙的體驗，這其中有兩個原因：第一，這是個非常吸引人的全新領域；第二，我們真的不知道它會走向何方。然而，AI技術實際上在音樂和商業上的應用都很有趣。

由諸多硅谷大亨聯合建立的AI非營利組織OpenAI，通過平克·弗洛伊德(Pink Floyd)、埃拉·菲茨傑拉德(Ella Fitzgerald)、2Pac等風格的歌曲創作，揭示了AI在音樂領域的全新應用，結果令人驚歎。只是，有時候這些曲目聽起來很像許多流行音樂的醉酒卡拉OK版本。

OpenAI最近剛剛發佈了音樂生成系統Jukebox，並在博客文章和論文中詳細介紹了該系統。該組織網站上稱，Jukebox是個神經網絡系統，可以生成各種流派和藝術家風格的原始音頻。

OpenAI還發布了Jukebox背後的代碼，以及一個用於探索生成音樂示例的工具。該組織承諾提供12分鐘的閱讀時間和10天的收聽時間。這是一筆不錯的交易。

Jukebox背後的科學非常有趣。爲了實現上述目標，研究人員使用原始音頻來訓練模型，作爲回報，模型也會生成原始音頻。爲了讓該系統發揮作用，研究人員首先使用卷積神經網絡對原始音頻進行編碼和壓縮。

在那之後，他們使用所謂的變壓器來生成新的壓縮音頻，然後對其進行上採樣，將其轉換回原始音頻。通過這樣的做法，神經網絡會生成以前不存在的新歌曲。

通過流派、藝術家和歌詞作爲輸入，Jukebox能夠輸出從零開始創作的新音樂樣本。舉例來說，如果你選擇了經典曲目《Never Gonna Give You Up》，Jukebox就會試圖不斷地生成更多類似風格的歌曲。

通過Jukebox Sample Explorer，我們可以瀏覽來自衆多藝術家的近8000首生成的曲目，這其中包括器樂和歌詞。如果有人已經聽厭了自己最喜歡的藝術家的所有歌曲，這對我們來說可能是一座新的“金礦”。

OpenAI團隊繼續致力於根據不同類型的啓動信息，如MIDI文件和STEM文件來生成音頻樣本。通過這種方式，他們認爲自己將能夠讓音樂家對未來幾代人有更大影響力。這可能是一次會永遠改變音樂文化的嘗試。（小小）

相關資訊