李彥宏:大模型已基本解決幻覺問題 發佈兩大“超級有用”AI技術
“過去24個月,AI行業的最大變化是什麼?是大模型基本消除了幻覺。”11月12日,百度創始人李彥宏在百度世界2024大會上,發表了主題爲《應用來了》的演講,發佈兩大賦能應用的AI技術:檢索增強的文生圖技術(iRAG)和無代碼工具“秒噠”。文心iRAG用於解決大模型在圖片生成上的幻覺問題,極大提升實用性;無代碼技術“秒噠”讓每個人都擁有程序員的能力,將打造數百萬“超級有用”的應用。
截至11月初,百度文心大模型的日均調用量超15億,相較5月披露的2億,增長7.5倍,相較一年前首次披露的5000萬次,更是增長約30倍。李彥宏表示“這個增速超出預期”,說明AI是真需求。他感慨,這條陡峭的增長曲線,代表着過去兩年中國大模型應用的爆發。
在AI應用的發展趨勢上,李彥宏表示,智能體是AI應用的最主流形態,即將迎來爆發點。他依次講解了公司、角色、工具和行業四大類智能體,將做智能體類比爲PC時代做網站、或是移動時代做自媒體賬號,“不同之處是智能體更像人、更智能,更像你的銷售、客服和助理。智能體可能會變成AI原生時代,內容、信息和服務的新載體。”
演講中,他還展示了文心智能體平臺TOP100智能體和TOP100產業應用,並表明 “百度不是要推出一個‘超級應用’,是要幫助更多人、更多企業打造出數百萬‘超級有用’的應用”。當天發佈的無代碼工具“秒噠”,具備無代碼編程、多智能體協作和多工具調用三大特性,用自然語言就能搭建一整套系統,將開啓一個“只靠想法就能賺錢的時代”。
解決圖片生成幻覺 文心iRAG發佈
幻覺問題是大模型廣泛應用的最大限制之一,而解決文本生成幻覺問題背後的技術就是RAG,即檢索增強。回顧過去兩年,李彥宏認爲,檢索增強生成(RAG)從百度特色,逐漸發展成爲了行業共識。目前,文字層面的RAG已經做得很好,基本讓大模型消除了幻覺;但在圖像等多模態方面,和RAG的結合還不夠,這也是百度希望重點突破的方向。
目前,基於大語言模型的文生圖還有比較嚴重的幻覺,尤其是針對長城、東方明珠、金字塔、愛因斯坦、貝多芬等特定地點、物品和人物,常常會出現張冠李戴的幻覺問題,讓生成的圖片“一眼假”,極大地影響了AI的實用性。
針對上述問題,百度開發了檢索增強的文生圖技術iRAG(image based RAG),將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,可以生成各種超真實的圖片,“整體效果遠遠超過文生圖原生系統,去除了機器味兒”。
李彥宏現場展示了一幅由文心大模型生成的大衆攬巡汽車飛躍長城的圖片。通過文心iRAG技術,無論是這款特定型號汽車的車型車標、還是作爲背景的長城,均未出現錯誤或變形的幻覺問題。同時展示的“愛因斯坦環遊世界”圖片中,愛因斯坦和各個背景景點的結合也與真實世界高度相似,質感接近照片。
iRAG技術極大地提高了AI生成圖片的可用性。比如在品牌宣傳上,以前拍一組海報動輒大幾十萬,但現在的創作成本接近於0。簡單而言,文心iRAG的商業價值體現在:無幻覺、超真實、沒成本,立等可取。此外,在影視作品、漫畫作品、連續畫本、海報製作等應用場景中,iRAG都可以大幅降低創作成本。
消除大模型的幻覺,也是AI應用爆發的基礎。在李彥宏看來,今天,基礎大模型能力就緒,即將迎來AI應用的羣星閃耀時刻。
智能體是下一個應用爆發點
“今天,全球所有頂尖科技公司都在關注智能體,但像百度這樣把智能體作爲最重要戰略方向的公司並不多。”李彥宏表示,就像PC時代的網站、移動時代的自媒體賬號,在AI原生時代,智能體將成爲內容、服務和信息的新載體。
他以公司類智能體舉例,在傳統的PC官網模式下,企業只能靜態地展示公司介紹、產品參數,但缺失主動推薦、及時響應和一對一服務能力;而公司智能體則可以根據顧客的需求推薦相應產品,在服務方面,也能更直接、快速地響應需求,能大幅地提升互動營銷的效率。比亞迪的官方智能體上線後,銷售轉化率提升119%,聯想AIPC智能體的9月互動率提升89%。
此外,李彥宏展示了角色、工具和行業等多類智能體的特色功能及使用場景。例如百度文庫和百度網盤聯合打造的工具類智能體“自由畫布”,讓用戶可以在一塊類似“畫布”的界面上自由拖拽文檔、音視頻等富媒體素材,迅速生成多模態內容。再比如,法律智能體“法行寶”,已回答用戶1660萬個法律問題,不僅能像專業律師一樣給出解答,還能計算法律賠償金額、撰寫法律文書,並推薦適配律師。
“智能體是AI應用的最主流形態,即將迎來它的爆發點。”在李彥宏看來,智能體的門檻低、天花板高,既能讓人人都上手,又能做出複雜強大的應用。當天,他展示了文心智能體平臺的TOP100智能體,既有農民院士智能體等角色類,也有工具、行業、職場、情感、娛樂等各類場景的智能體。目前,文心智能體平臺已吸引了15萬家企業和80萬名開發者。
無代碼“秒噠” 打造數百萬“超級有用”的應用
演講結尾,李彥宏帶來了當天的One More Thing——無代碼工具“秒噠”,一款不需要寫代碼就能實現任意想法的軟件,涵蓋無代碼編程、多智能體協作以及多工具調用等特點,只需說說話,就能構建出各種應用。它可以幫助更多人、更多企業打造出數百萬“超級有用”的應用。
他介紹說,無代碼編程,由大模型直接生成代碼,不需要人寫一行代碼。它門檻很低,人人可上手;多智能體協作,是基於文心大模型的思考和規劃能力,實現對不同智能體的調度和編排;多工具調用,是通過文心大模型的工具調用能力,可調用網頁檢索、iRAG、地圖API等各類型工具。
演講現場,李彥宏以蘿蔔快跑新技術發佈會爲例,展示了活動報名系統的搭建過程:只要在“秒噠”上用中文描述需求,並補充一份帶有大會時間地點主題的文檔,就可以指揮多個智能體協作,完成報名系統的開發。
就像工作場景中的團隊合作一樣,在現場演示的“秒噠”開發過程中,小組長、策劃、小編、程序員和質檢員五個智能體互相協作,協同完成策劃、內容和開發等各種工作,還能自動識別bug、調用各種工具。李彥宏表示,這是“迄今爲止人類歷史上最複雜的多智能體協作工具”。
“一個人通過自然語言交互,就可以完成一套系統的搭建,除了上面展示的邀請系統,還可以做任意場景下的各種應用,應用的複雜度也會隨着我們技術的提升不斷提升。”李彥宏總結說,這意味着每個人自己就能指揮多個智能體來協同完成任務,“只要有想法,你就可以心想事成,我們將迎來一個前所未有的,只靠想法就能賺錢的時代。”
在他看來,無代碼的秒噠讓每個人都具備程序員的能力,會說話就能做出應用,極大提升了人類的工作效率。“AI之所以被稱爲產業革命級的機會,就是因爲它對社會經濟,帶來了生產力的無限擴張。”