【獨家】快手上線自研文生圖大模型“可圖”,參數規模達十億級

5月30日,界面新聞從多位知情人士處獲悉,快手自研文生圖大模型“可圖”已於近日正式對外開放。“可圖”大模型目前支持文生圖和圖生圖兩類功能,可用於AI創作圖像以及AI形象定製。用戶可通過“可圖”微信小程序和網頁版使用,這也是快手首次將其自研的系列大模型對外開放。

據一位接近快手的人士透露,去年年初,快手組建了大模型研發團隊,並依託其在AIGC算法和大規模語言模型方面的技術積累進行大模型開發和訓練,包含大語言模型、文生圖大模型、視頻生成大模型等多個方向,負責人爲技術副總裁張迪。從組織架構上看,快手大模型團隊隸屬於快手社區科學線。

“可圖”大模型的參數規模達十億級,這些數據來自於開源社區、快手內部構建和自研AI技術合成,覆蓋了常見的千萬級中文實體概念,還引入強化學習和獎勵模型技術(RLHF),解決了文生圖大模型在長文本和複雜語義文本輸入下的效果問題。

實際上,去年9月,“可圖”大模型平臺已在快手開啓內測,面向內部業務團隊提供支持。快手在App評論區內測的“AI玩評”和“AI小快”等多種互動玩法集合了文生圖、圖生圖、擴圖等多個功能,依託的也是“可圖”大模型的能力。

從已上線的功能來看,“可圖”主要面向消費端用戶,提供一系列互動玩法和熱點應用。比如,“AI形象定製”即圖生圖功能,可通過人臉保持技術,保留人像的自然特徵,一鍵生成不同風格的人像作品。但在產品模式上,與妙鴨相機等主打寫實人像的產品不同,“可圖”更側重趣味性,支持用戶上傳圖片生成復古像素風和童年寫真,也涵蓋了當紅的黏土風特效及主打寫實人像的“韓式寫真”等模式。

同時,“可圖”大模型也可爲創作者提供工具化能力,輔助創作者的圖像、視頻素材的創作和生產。

在2024年一季度財報電話會上,快手CEO程一笑曾表示,今年一季度,快手穩步推進自研大模型各項性能的迭代提升,並且加快大模型在各業務場景的應用。近期,快手也正式推出了第一個多模態大語言模型。

據界面新聞了解,快手內部今年明確了大模型應用策略,主要包含理解、互動和生成三個方向,具體的應用場景包括全域大模型內容理解、AI互動、商業場景的數字人與AIGC等。此次發佈的“可圖”就是快手大模型應用策略中重要一環。

目前,AIGC輔助生成營銷素材已經被抖音、快手、愛奇藝等多個平臺應用。其中,使用字節跳動AIGC能力進行營銷增長的企業超過3000家,而快手第一季度AIGC營銷素材單日消耗峰值已突破1000萬元。