☰

【獨家】快手上線自研文生圖大模型“可圖”，參數規模達十億級

5月30日，界面新聞從多位知情人士處獲悉，快手自研文生圖大模型“可圖”已於近日正式對外開放。“可圖”大模型目前支持文生圖和圖生圖兩類功能，可用於AI創作圖像以及AI形象定製。用戶可通過“可圖”微信小程序和網頁版使用，這也是快手首次將其自研的系列大模型對外開放。

據一位接近快手的人士透露，去年年初，快手組建了大模型研發團隊，並依託其在AIGC算法和大規模語言模型方面的技術積累進行大模型開發和訓練，包含大語言模型、文生圖大模型、視頻生成大模型等多個方向，負責人爲技術副總裁張迪。從組織架構上看，快手大模型團隊隸屬於快手社區科學線。

“可圖”大模型的參數規模達十億級，這些數據來自於開源社區、快手內部構建和自研AI技術合成，覆蓋了常見的千萬級中文實體概念，還引入強化學習和獎勵模型技術（RLHF），解決了文生圖大模型在長文本和複雜語義文本輸入下的效果問題。

實際上，去年9月，“可圖”大模型平臺已在快手開啓內測，面向內部業務團隊提供支持。快手在App評論區內測的“AI玩評”和“AI小快”等多種互動玩法集合了文生圖、圖生圖、擴圖等多個功能，依託的也是“可圖”大模型的能力。

從已上線的功能來看，“可圖”主要面向消費端用戶，提供一系列互動玩法和熱點應用。比如，“AI形象定製”即圖生圖功能，可通過人臉保持技術，保留人像的自然特徵，一鍵生成不同風格的人像作品。但在產品模式上，與妙鴨相機等主打寫實人像的產品不同，“可圖”更側重趣味性，支持用戶上傳圖片生成復古像素風和童年寫真，也涵蓋了當紅的黏土風特效及主打寫實人像的“韓式寫真”等模式。

同時，“可圖”大模型也可爲創作者提供工具化能力，輔助創作者的圖像、視頻素材的創作和生產。

在2024年一季度財報電話會上，快手CEO程一笑曾表示，今年一季度，快手穩步推進自研大模型各項性能的迭代提升，並且加快大模型在各業務場景的應用。近期，快手也正式推出了第一個多模態大語言模型。

據界面新聞了解，快手內部今年明確了大模型應用策略，主要包含理解、互動和生成三個方向，具體的應用場景包括全域大模型內容理解、AI互動、商業場景的數字人與AIGC等。此次發佈的“可圖”就是快手大模型應用策略中重要一環。

目前，AIGC輔助生成營銷素材已經被抖音、快手、愛奇藝等多個平臺應用。其中，使用字節跳動AIGC能力進行營銷增長的企業超過3000家，而快手第一季度AIGC營銷素材單日消耗峰值已突破1000萬元。

【獨家】快手上線自研文生圖大模型“可圖”，參數規模達十億級

相關資訊