拒絕機械感!30秒生成商用級歌曲,「歌歌AI」完成新一輪融資 | 36氪首發
作者 | 鄧詠儀
編輯 | 蘇建勳
在鍵盤上敲出短短一行命令:請給我寫一首充滿喜悅/悲傷/的歌,等待片刻,一首完整的、甚至帶有人聲、歌詞的”歌曲“就已經完成——進入2024年,Suno等產品帶來的熱度還沒散去,如今國內已經有不少瞄準AI音樂領域的產品,如雨後春筍般出現。
36氪此前報道的「歌歌AI」是其中的一員。這家公司近期獲得新一輪數百萬元投資,投資方爲錫創投。
音律閃動成立於2022年8月,瞄準AI生成音樂方向,其主要產品爲「歌歌AI」app。
音律閃動CTO王樞沛告訴36氪,音律閃動的團隊爲來自互聯網大廠的技術專家,以及在音樂產業中的資深製作人。在生成式AI出現前,團隊就已經有通過AI技術來探究在音樂領域中的應用——早在2016年,團隊成員就開始開發AI寫歌產品,並有項目創業經驗。
真正促使團隊創業的,是在2022年左右看到以Transformer架構爲主的技術突破,“我們認爲,這個技術能夠真正改變音樂產業。”王樞沛表示。因此,從2023年成立開始,音律閃動就開始從底層模型開始訓練,在經歷2023年的小程序版試運營後,在4月完成了獨立的app開發,近期剛剛上線。
“讓所有人都成爲音樂人”是歌歌AI的目標,從產品形態來看,歌歌AI是一款面向所有愛音樂的用戶的AI寫歌軟件。使用方法也非常“傻瓜式”,容易上手——
用戶進入app界面,即可看到三種模式:自由模式、驚喜模式、純音樂模式,通過對話和“AI製作人”溝通,生成自己想要的音樂。
在自由模式下,用戶可以輸入簡單一句話的Prompt,讓AI生成擁有具體主題、完整旋律和人聲的歌曲。
比如,36氪就以自由和勇氣爲主題,請AI幫忙寫一首歌曲,不到1分鐘內,歌歌AI就生成了一首時長爲2分20秒的《希望之歌》,並且帶有完整填詞。
來源:歌歌AI
整首歌擁有比較和諧的旋律和編曲,並且旋律變換也相對豐富。不過在填詞上,還是有個別詞句會不通,或者斷句尚有問題,但用戶可以通過手動調整來完成歌詞修改。哪怕不懂樂理,還可以通過簡單點選操作,來調整每個字的音高。
來源:歌歌AI
“除了修改歌詞和旋律,還有包括AI演唱的這個聲音,用戶也可以在選擇付費後進行修改,替換成自己的聲音。”王樞沛表示。
對於要求更高的用戶,歌歌AI還提供了更專業的“驚喜模式”,能夠生成滿足商業級場景的歌曲。
在這一模式下,用戶能夠對音樂風格、具體的配器提出更多要求。AI能夠生成更完整的旋律,會有完整的主歌、副歌、橋樑等結構。
並且,人聲的變換也更加豐富——無論是顫音、旋律的高低變換過度都更自然,聽起來更接近自然人聲演唱的狀態,“AI感”減少很多。
在所有模式下,歌歌AI都基於一定的免費積分,用戶可以消耗積分以生成音樂。一旦用戶對AI生成的demo比較滿意,希望“擴寫”,就能在對話框裡和“AI製作人”對話,以修改風格等等,同時付費來讓AI生成更完整的歌曲。目前的三檔付費價格分別爲包月18元、48元、98元。
音律閃動COO王樞沛對36氪表示,驚喜模式使用的是端到端的大模型技術,爲了保證音樂效果質量更高,暫時不支持具體的歌詞和人聲修改,這也是與市面上大部分AI生成音樂產品相比,歌歌AI的優勢所在。
“AI文字、圖片生成現在都有開源框架,技術層面是比較開放的,但從AI生成音樂賽道整體來看,技術路線是比較封閉的,各家都有自己的訓練技術差異。”王樞沛表示。
總體來說,上一代將AI技術應用到音樂中的嘗試,普遍能做到的程度是,先生成MIDI音樂,即簡單將旋律數字化,形成較爲單調、機器感的單旋律。
在上一代AI技術逐步成熟之後,AI生成音樂進入到了用小模型、專家系統訓練的階段。簡單而言,一種方式是通過人工標註大量的音樂片段,分“科目”訓練模型,比如旋律、歌詞、編曲等,都有單獨的小模型。等到這些模型能夠產出比較成熟的片段之後,再“拼接”起來,形成完整旋律。但這種方法的缺點是,由於各個元素是割裂的,拼接之後的機器感難以消除,也很難達到和諧的效果。
而從AI生成音樂的訓練上,爲了保證歌曲能做到質量更高、更自然,歌歌AI對標海外產品,選擇了端到端的大模型路線,即音樂數據不需要經過特別細緻的處理,就輸入到模型中進行訓練。這樣能夠生成比較完整、統一的旋律。
歌歌AI的另一個亮點在於,並不侷限於“用AI寫歌”的定位上,而是希望能夠基於生成式AI技術,真正讓音樂創作、分發方式的鏈條發生根本性變化。
音律閃動團隊認爲,目前音樂平臺的推薦音樂內容千篇一律,並且推薦內容頁不真正切合需求。“全國現在每天大概產生新產生約十幾萬首歌,但生成式AI技術能夠讓這個數字變成成百上千萬。”王樞沛表示,AI技術的普及,也會讓人們生成更個性化的音樂,成爲打破現在音樂巨頭壟斷的機遇。
除了歌曲生成等基本功能外,歌歌AI也拓展了多個板塊,涉及生成和分發。
比如,用戶通過AI模型錄入自己聲音並生成歌曲,可選擇不同風格和曲風,甚至發行全網。
歌歌AI近期也正在與國內主要音樂平臺洽談對接,以後希望做到的效果是,用戶生成音樂後可以做到自動修音、AI混音處理,最後——全網一鍵發行,用戶能夠通過自己生成的AI音樂,獲得版稅。
並且,和短視頻的結合也是重要的傳播節點。當前,歌歌AI已經能夠支持下載帶有AI音樂的小視頻,未來也會拓展到AI生成視頻、直播場景。
本輪融資後,歌歌AI團隊也會繼續加速產品迭代,並且投入到市場增長方面。
團隊方面,目前歌歌AI團隊不到10人,CEO龍勇擁有20年音樂製作經驗,曾是中國好聲音、中國有嘻哈、TME官方合作伙伴,有豐富製作運營音樂和版權經驗;COO王樞沛是浙江大學工學/ 美國伯克利音樂學院音樂製作和吉他表演雙專業學士;CTO張文鉑爲「我要寫歌」APP創始人。