輝達又出手!發表新AI模型Fugatto 「可改聲音」

AI領頭羊輝達(Nvidia)又出招。(示意圖:shutterstock/達志)

AI晶片巨頭輝達25日秀出全新AI模型Fugatto,可生成音樂和音訊,不僅能修改還會生成全新聲音,此模型主要鎖定音樂、電影和電玩製作人,但還沒有公開發表的計劃。

輝達的新模型能根據文本描述,生成音樂與音效,還能讓聲音產生新奇的變化,例如小號這種樂器會發出狗叫聲。

此新模型與其他AI技術的差別在於,能吸收和修改既有音訊,像是將鋼琴曲轉換成人類歌聲,或讓錄好的話語改變口音及情緒表達。

輝達的全新AI模型是照開放原始碼數據訓練,但是否公開以及公開方式,輝達表示還在討論。

OpenAI 今年初推出影像生成工具Sora,臉書母公司Meta10月初發表類似工具Movie Gen,新創公司Runway開發Gen-3 Alpha,都是透過文本提示生成聲音或影像,輝達的Fugatto也加入這個行列。