相信數字的力量:被 AI 改寫的視頻生產與消費的故事

在一家電商企業,一個 5 人團隊每天可以製作分發 3000-5000 條高質量的個性化視頻,快速精準觸達潛在客羣。這是怎麼做到的?

這是一家 AIGC 內容營銷平臺——筷子科技服務過的真實案例。用 AI 工具生產視頻,這事本身可能不稀奇,畢竟 AI 這個噱頭已經聽麻了。但現實中,企業用 AI 能幫自己幹多少活,卻顛覆想象。

筷子科技 CEO 陳萬鋒如是說:

「商業視頻的生產跟做採訪一樣,需要編導的過程。我們解構了大量視頻數據,通過對商業視頻的分析,餵給多模態大模型,能夠訓練出一個理解商業視頻的,有點像 AI 編導的模型。我們一個產品叫靈感三件套,比如說你看到我的競爭品牌有一個視頻挺好的,那它爲什麼好?你可以上傳到 AI 上,它可能幾秒鐘時間就幫你分析出來,這個視頻的每個段落到底在講什麼,裡面到底畫面是怎麼展現的,甚至他是怎麼拍的,口播在講什麼,同時也幫你分析說他爲什麼好、爲什麼不好。通過這樣,你就可以把編導能力賦能給所有的團隊。」

近日,在由騰訊雲發起的面向科技企業技術決策者羣體的高端知識分享與技術探索平臺 CTO100 清遠站活動現場,我們聽到了生動的案例分享。

極客公園:筷子科技作爲一家 SaaS 創業公司,如何能擁有這麼厲害的 AI 能力?

筷子科技 CEO 陳萬鋒:那天我跟一個客戶去做 demo 的時候,他說你們的平臺優化的非常好。因爲我們完全是在瀏覽器裡面,比如視頻內容的生產,包括剪輯、AI 的生成,線上分發,都集合在一起,其實是非常重底層的一個平臺。

通過把我們整個 AIGC 內容工作流搬到騰訊雲上面,實現了整個工作流的客戶方面的體感的提效達到了 240%。能夠優化到這種程度,而且用戶其實體感上能夠感受到,我們也覺得非常開心。」

極客公園:如何像筷子科技一樣快速做好大模型時代的轉型呢?

筷子科技 CEO 陳萬鋒:我們是做視頻類型(業務的),那它其實每一次這個調用要用到非常大的這個數據量。我們希望雲服務廠商能跟我們一起能夠往前去推進更多創新的能力。

跟騰訊雲合作,說實話不是一夜之間就決定的,這是一個非常重要的決定。因爲引入新的雲供應商來做我們主雲的架構,客戶的體驗我們希望是提升很多的。

這個過程中其實考慮了幾個點,第一騰訊雲已經經過了多年打磨,在很多行業有成功案例,綜合能力很強。

第二騰訊雲的確在 AI 時代儲備了很多的算力資源,能夠較長期跟我們探索模型的成長,包括模型的部署的需求。

第三,騰訊有全球化的能力,能夠用全球化的雲部署把我們這個工具或者應用平臺能伸向更多的市場。

如果說筷子科技的 AIGC 轉型,切中了 AI 重塑視頻生產的脈搏,在另一端,視頻的呈現也正在潤物無聲地變化。

樂播投屏是一家在投屏領域做了十年的公司。隨着大家身邊帶屏幕的設備越來越多,投屏的場景也越來越豐富,家庭、酒店、商旅,辦公,車機等等這些地方,幾乎都有樂播投屏的存在。就是這個讓你熟悉到感覺不到存在的場景——投屏,正在迎來 AI 變革。ChatGPT 用自然語言交互(LUI)的方式驚豔了全世界,GPT-4o 進一步讓大家觀察到了自然語言對話,喚醒屏幕及其應用的便捷和驚奇。

極客公園:ChatGPT 讓我們看到從圖形交互界面到自然語言交互的發展趨勢,重塑所有軟硬件。今年樂播科技的產品有哪些 AI 計劃?在這方面會跟騰訊雲有哪些合作?

樂播投屏 CTO 譚振林:我們希望以後用戶可以在手機上直接通過語音交互形成他的訴求,然後這個訴求經過大模型的處理,就會被理解成計算機要去執行的一些任務。這些任務的結果我們可以讓它在大屏端去完成展示。

因爲其實大量需要新的交互方式的人,往往是一些使用計算機,使用傳統的手機交互不太方便的人,可能是老人、小孩,他可能需要用方言,更自然、更自在。那麼騰訊雲的語音方案比較有優勢,它在方言的知識上相對領先。第二,用戶的指令要經過大模型的處理,然後再形成結果,這個過程中也可以和騰訊雲做更多的合作。

騰訊雲混元大模型採取高效的 MOE 架構,更進一步,樂播投屏可以根據不同的端側、不同場景靈活選擇 lite、standard、pro 等不同版本的大模型,再結合騰訊雲大模型知識引擎做進一步開發,形成原生的語音助手。就像電影《Her》中展現的一樣,一個越來越像人類的語音助手,不僅可以幫你完成投屏這樣的任務,甚至可以沉浸式地跟你聊上一會投屏內容。

極客公園:樂播使用了騰訊雲不少產品。對樂播科技業務特性來說,最有用、好用的產品/服務是什麼?

樂播投屏 CTO 譚振林:樂播解決的是很多的設備互相連通的問題,所以在產品過程中需要解決大量兼容性的問題,從芯片、從硬件平臺、操作系統、各個應用場景去解決設備之間連通的兼容問題和它的效果的這種一致性。

當我們有大量的用戶,他們都需要接入到一個有投屏的會議場景中來,能不能夠非常清晰地把他的聲音,把他的畫面傳輸過來,它有可能是在微信小程序裡,也可能是在一個安卓的手機端,我們要能夠很好地去糅合到一個流暢的會議過程,這裡面其實是有比較多技術要去解決的。

比如說跨網絡遠端的投屏,就會要用到 RTC 的技術來實現這樣的一個效果。大量的用戶加入的過程中,我們能夠有一個非常穩定的聲音的傳輸和響應,這個其實是有一個 RTC 的技術積累在裡面。

極客公園:在 IT 資源降本增效上,騰訊雲的服務和產品如何幫助到樂播科技?效果如何?

樂播投屏 CTO 譚振林:除了像 TRTC 這樣強大的技術基礎,騰訊雲也以更優性價比的雲產品,幫助樂播在智能化升級的過程中,降低單位成本。我們在前一段時間的合作中完成了我們優化整個供應商結構的目標,同時也實現了將我們的 IT 成本下降超過 20% 的目標。

在和騰訊雲的這個合作過程中,我們也使用到了 COS 等這些日誌的工具。通過這個日誌服務我們能夠非常清晰的去跟蹤每一個用戶,使用我們服務過程中他有沒有碰到問題、他有沒有成功地完成他的目標,這其實也給了我們產品質量一個非常大的一個幫助。