Soul App公佈自研多模態大模型最新進展

來源:環球網

【環球網科技報道 記者 李文瑤】10月16日消息,在迪拜舉辦的GITEX GLOBAL海灣信息技術博覽會上,新型社交平臺Soul App對外展示最新自研多模態大模型。據瞭解,該模型具備多模態理解、真實擬人、文字對話、語音通話、多語種等特性。用戶可以通過數字裝置,即時生成3D虛擬數字分身,通過實時動作捕捉與還原,體驗自然、流暢、沉浸式的多模態互動。

Soul App方面表示,在現階段,Soul 3D虛擬人能力已經實現全面升級,形成了成熟的集成3D虛擬人能力的多模態AI交互方案——即集合文字、語音、動作交互的多模態大模型方向,實現更接近人類模式的互動體驗和更高效、自然、豐富維度的信息傳遞。

目前,Soul已先後上線了自研語言大模型Soul X,以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月,Soul還在社交行業中較早推出了自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風格語言,實現更接近生活日常的交互對話和“類真人”的情感陪伴體驗。

接下來,通過最新集成的3D虛擬人能力和多模態端到端大模型的AI交互方案,Soul用戶自主打造的3D虛擬人,可以作爲數字世界的多模態全能助手,在平臺羣聊派對、瞬間廣場等豐富社交場景中全面賦能用戶的關係發現、建立、沉澱環節,拓展新關係的同時,提供高質量、趣味性、沉浸式的人機交互體驗,反饋真實、自然的情感陪伴。

Soul App CTO陶明表示:“作爲天然的流量聚集地和交互入口,社交被視爲AI率先落地的最佳場景之一。我們將圍繞用戶的實際社交需求和具體社交場景,持續加大對AI技術的投入,給用戶帶來長期的可持續的價值。預計今年年底,Soul多模態端到端大模型將再次升級,推出全雙工視頻通話能力,讓用戶可以真正便捷、自然地體驗到包括文字、語音、視覺在內的多模態創新交互。”