從百度的兩季創業大賽,看大模型應用風向變化

李彥宏認爲,智能體相當於 PC 時代的網站和自媒體時代的賬號。ChatGPT 催生大模型熱潮將近兩年,大模型的能力持續提升,調用價格持續下降,基於大模型開發應用的探索也進入新階段。9 月 25 日,第二季百度 “文心杯” 創業大賽結束,8 個團隊被選爲優勝者,他們將得到百度的數千萬元和資源投資。百度稱,未來還會在技術、產品、發展戰略、資本合作等方面長期支持優勝團隊。百度 CEO 李彥宏在頒獎致辭中說,現在大模型最初那種興奮勁兒逐漸過了,許多創業者可能會失落、迷茫、甚至懷疑未來[圖文:wuhan.wfswhb.com]。“因爲人們總是高估技術的短期價值,卻低估技術的長期價值。”李彥宏認爲大模型是一次顛覆式的技術革命,長期前景非常樂觀,“悲觀者永遠正確,而未來卻是由樂觀者創造的”。他說,百度歡迎更多的創業者和開發者加入,一起投身到這場 AI 革命中。在決出優勝者之外,這場舉辦兩年的創業大賽,還提供了一個少見的窗口,可以觀察國內大模型應用探索的風向變化:基於大模型開發應用的門檻降低。參賽團隊從去年近 1000 支增長到 1600 支,【來源:wuhan.bjtmm.com】30% 的團隊沒有專業程序員。應用場景更多元,但開發模式開始聚焦。去年 約 30% 的項目在通用辦公及營銷領域。今年領域越發分散,包括文娛、電商、營銷、醫療、辦公、硬件、企業服務等衆多領域,超過 60% 的團隊聚焦智能體應用。在李彥宏看來{出處:wuhan.10cq.net},大模型應用發展經歷多個階段:剛開始是 Copilot 階段,大模型輔助人工作,最後產出成果,需要人把最後一道關,確定達到了效果再交付。再往下走,就是 Agent 智能體階段,大模型能自主使用工具解決任務,[圖文:wuhan.nmyhzs.com]有自我反思、自我進化的能力。最後會到 Al Worker 階段,能夠像人一樣,做各種各樣的腦力和體力勞動,可以獨立完成各種工作。他認爲當前正處於 Agent 智能體階段,智能體是大模型最重要的發展方向。“智能體相當於 PC 時代的網站和自媒體時代的賬號。它最明顯的特點是門檻足夠低,誰都能上手,天花板又足夠高,可以做出非常複雜,非常強大的應用。”李彥宏說,將來會有數以百萬量級的智能體出現,形成龐大的智能體生態。他希望創業者和開發們用百度的基礎模型、開發工具以及分發平臺,做出 AI 時代的超級應用。百度 “文心杯” 創業大賽·第二季告一段落,但其建設大模型創業生態的動作還會繼續。8 個優勝團隊如何開發大模型應用過去一年多,大語言模型能力迅速提升,參數規模普遍從千億增長到萬億,融合語音、圖像、文本的多模態模型成爲熱門趨勢,生成圖像、視頻的模型不斷迭代。這些變化擴展了大模型應用的邊界,決定了開發者能做出什麼樣的智能體應用。這一季優勝者團隊開發大模型的首要特徵是,融合大模型多種模態能力提供服務。獲得一等獎的極睿科技,主要業務是面向電商場景,利用大模型生成圖片、文字等多模態內容,爲消費品牌提供覆蓋圖文及短視頻的 AI 素材製作、管理工具及轉化服務。{出處:wuhan.remaile.com}獲得二等獎的虛擬角色社交互動平臺 Kotoko、AI 漫畫平臺水母智能,以及獲得三等獎的 “AI+ 設計” 應用軟件亦心科技和 AI-Native 金融投研工具問智科技等,雖然聚焦的場景不同,但都深度融合大模型技術,部分應用融合了視覺理解、文字生成、圖像生成、語音交互等多模態能力。多模態融合也是全球大模型應用開發的趨勢之一。今年 9 月,風投機構 a16z 公佈上半年最受歡迎的 100 個大模型應用,基本沒有隻提供文本生成和交互能力的聊天機器人式應用,融合圖像、視覺能力的應用正在成爲主流【來源:wuhan.renmin1.com】。OpenAI 開發的 ChatGPT,在過去一年多也在產品中融合了語音交互、圖像理解、圖像生成等能力。優勝者團隊開發大模型應用的第二個特徵是,面對目標場景,提供相對完整的解決方案。比如師者 AI 是一個基於全科教育大模型的引導式的 AI Tutor 應用,在這季創業大賽中獲得二等獎。他們調用多個模型,給用戶提供服務時,不是直接給答案,而是會調用大模型的能力,引導和鼓勵用戶答題,幫學生從答題過程中掌握知識點。類似的還有鏡象科技,它是一個心理診療 AI 智能體,不僅能多模態識別算法對用戶心理健康進行評估(AI 測評師),還能用自然語言處理和情感識別技術爲心理亞健康人羣提供傾訴陪伴和情緒疏導(AI 傾訴師),以及爲輕中度患者提供心理干預治療(AI 心理師)。獲獎項目 LightAI 開發了私域社媒流量運營 AI Agent 產品矩陣,目標是用大模型提高企業的獲客及運營效率。優勝大模型應用的第三個典型特徵是,調用大模型的能力主動提供服務,引導用戶發掘大模型的能力,而不是等待用戶有了迫切需求再解決問題。比如在虛擬角色社交互動平臺 Kotoko 中,用戶不知道如何開始互動時,[圖文:wuhan.guangliao.net]平臺中基於大模型開發的智能體,會主動發起交流對話,引導用戶。在問智科技開發的金融投研工具中,大模型每天會主動推薦 5 個股票,然後給出相應的分析。極睿科技開發的剪輯工具,可以自動把帶貨主播的直播內容,剪輯成方便投放的素材等。“我們認爲,未來在各行各業,在各個領域都會依據自己具體的場景,根據自己特有的經驗、規則、數據等等,去做出來這些智能體。” 李彥宏此前在一場活動上說。百度文心杯大賽的優勝者們,只是這個龐大生態的一部分。“智能體是大模型最重要的發展方向”“我們去年說要卷應用、大家都去做應用,其實很多人還是說不知道該怎麼做。” 李彥宏今年 9 月在內部演講中說。“智能體提供了一個非常直接、非常高效、非常簡單的方式。”廣義來說,智能體(Agent)是指能在動態世界中獨立交互的數字系統。它並不是一個新事物,在互聯網時代就已經存在。比如可以自動識別垃圾郵件或重要郵件,給它們分類的電子郵件過濾器,就是一種簡單的 Agent。但是這種模式下,它們只能在特定場景下,按照開發者提前設定好的規則完成任務。如果開發複雜的智能體,需要投入大量人手,基於規則編程,或者針對性訓練機器學習模型等。能夠理解自然語言、語音、圖像等數據的大模型{出處:wuhan.fk0792.com},給智能體帶來了新的可能【來源:wuhan.rbgczx.com】。理想狀態下,大模型驅動的智能體,可以根據用戶隨時發起的指令,甚至是用戶沒有意識到的需求,靈活地規劃行動,然後調度各類在線工具完成任務。在這個過程中,智能體還可以與其他智能體或人合作,學習完成任務的辦法,改進表現。比如這次獲得一等獎的極睿科技開發的電商素材生成工具,就是朝着智能體方向開發的應用。根據極睿科技 CEO 武彬介紹,他們的工具會調用一批大模型完成任務:客戶上傳產品素材後,會用自研的傳統模型識別,[圖文:wuhan.zhuangwangcun.com]是模特圖片還是產品圖片,是拍攝視頻還是直播視頻,裡面是什麼樣的商品,如果是衣服,會識別衣領形狀、花紋等細節。這些模型識別出來的信息,會提供給大模型,讓它綜合用戶的指令,生成圖片、視頻、文案等。“之前還需要不少人修改大模型生成的內容,{出處:wuhan.fjhqrhy.com}現在只需要兩三個人,就可以製作出能夠投入使用的素材。” 武彬說。在李彥宏來看,隨着基礎模型的日益強大,開發智能體會越來越簡單,只要用 “人話” 把工作流說清楚,再配以專有知識庫,就可以做出一個很有價值的智能體,“比互聯網時代製作一個網頁還簡單”。但簡單只是相對概念。如果從基礎模型開始研發,做一個智能體要比開發一款傳統互聯網應用難得多。但現在越來越多開發基礎模型的公司,比如 Google、微軟、OpenAI 等,都在投資開發一系列工具,讓開發者更簡單地調用它們的大模型,開發各類智能體,想要搭建新時代的基礎設施。百度更是把智能體視爲大模型時代最重要的戰略、最重要的發展方向,希望能夠主導建立 AI 原生應用和智能體生態。在昨天的頒獎詞中,李彥宏介紹了百度採取的一系列舉措:提供基礎大模型系列,包括文心大模型旗艦版 ERNIE 3.5、4.0、4.0 Turbo,以及可以免費調用的輕量版 ERNIE Speed、Lite、Tiny;提供應用開發工具,包括智能體開發工具 AgentBuilder,AI 原生應用開發工具 AppBuilder,以及模型定製工具 ModelBuilder;開放搜索渠道,將其作爲智能體分發渠道,讓智能體易分發,讓創業者有錢賺。【來源:wuhan.sbkxw.com】目前來看,百度的智能體生態建設已經有了初步成果。根據百度方面介紹,在百度開發智能體的商戶已超 1.6 萬家,覆蓋教育、法律和 B2B 等行業。目前百度搜索每天分發超過 1000 萬次智能體,還在快速增長。今年 8 月的財報會上,李彥宏把智能體視爲搜索行業的變革力量,它將使百度抓住實質性的長期增長機會,改變搜索的使用方式,鞏固百度在 AI 搜索領域的領導地位。他認爲,智能體將成爲 AI 時代的 “新型網站生態系統”。