趣丸科技開源語音大模型MaskGCT

10月24日,趣丸科技宣佈與香港中文大學(深圳)聯合研發的語音大模型“MaskGCT”正式在Amphion系統中開源,面向全球用戶開放使用。區別於傳統TTS模型,該模型採用掩碼生成模型與語音表徵解耦編碼的技術範式,在聲音克隆、跨語種合成、語音控制等任務中性能表現突出。據介紹,MaskGCT在三個TTS基準數據集上都達到了SOTA效果。