AI大模型技術能力評估報告媒體溝通會

時間:2023年7月19日上午

地址:百度科技園K1

主持人:尊敬的各位來賓、各位媒體同仁,大家上午好!非常榮幸邀請各位嘉賓來到北京百度參與AI大模型技術能力評估報告媒體吹風會,我是今天的主持人周恩正。

一直以來作爲大模型技術突破者和應用引領者,文心大模型快速迭代升級,得益於百度芯片、模型、框架、應用四層技術優勢,知識增強的核心特色和大模型生態優勢,不久前,多個權威測評顯示,由文心大模型3.5支持的文心一言綜合能力評測得分超過ChatGPT,遙遙領先其他大模型,文心大模型部分中文能力超過GPT-4。

國際諮詢公司IDC是全球著名的信息技術和消費科技諮詢權威機構,近日IDC發佈首個大模型評估報告《AI大模型技術能力評估報告2023》,重點調研了9家中國市場主流大模型技術廠商,其中百度文心大模型3.5,以12項指標7個滿分,綜合平分排名第一,代表基礎能力的算法模型是唯一滿分,代表產業應用情況的行業覆蓋,百度也是唯一滿分。這三項絕對第一含金量非常高,既有基礎能力,也有產業應用覆蓋能力。今天在這裡很榮幸邀請各位共同分享,進一步瞭解評估報告內容,今天到場的主要嘉賓有百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜,百度集團科技與社會研究中心主任餘歡,同時還有現場170多家中央及署名當黨央媒,科技、文娛等行業媒體,再次感謝各位參與。

IDC本次發佈的《AI大模型技術能力評估報告》,投入時間早、研究週期長,評估最全面,與外部已有的憑感覺打分的報告不同,IDC從產品、服務、行業三個維度,12項指標出發,對大模型的底層基礎能力,和產業落地進行深入全面的研究,接下來首先邀請百度集團科技與社會研究中心主任餘歡,爲我們帶來AI大模型評估報告解讀,掌聲有請!

餘歡:各位老師大家上午好!

我跟各位報告一下,AI大模型技術能力評估報告的評估維度,以及評估結果。

首先介紹IDC和評估報告結果之前,我想跟大家記住這三個核心信息,三個絕對第一,剛纔我們的主持人提到了,百度文心大模型3.5總分這次獲得唯一的絕對第一,它體現的是我們大模型的綜合實力,第二部分在算法模型這個維度,獲得了絕對的第一,也是唯一第一。它體現的是我們技術實力和基礎能力,第三部分在行業覆蓋上,我們也是唯一併且絕對的第一。它體現的是我們在產業落地產業應用的領先性。

很多朋友對於IDC不瞭解,我介紹一下,大家看到很多不同機構的報告,爲什麼IDC報告比較重要?首先IDC做分析諮詢已經超過五六十年的時間了,它在全球110多個國家都會跟蹤技術趨勢,並且也是最早進入中國市場的科技市場研究機構之一。舉個例子來看,大家都比較清楚,全球有三大評級機構,其實IDC、Gartner和Forrester三大評級機構,IDC有本土市場的結合,它的客戶有微軟、谷歌、英偉達、IBM、英特爾、百度、華爲、阿里巴巴、騰訊等,商業新聞提及率是第一位的,過去10年被超100個IPO申請引用,它被很多廠商,很多行業客戶,在做技術招投標和採購的時候,IDC的數據和指標是作爲重要的參考依據。

在AI領域,IDC有兩個核心的報告,一個是《中國人工智能公有云服務市場份額》它體現的是AI這個行業在過去的表現情況。百度也有幸在過去幾年在過去幾年獲得第一位。第二個是《AI大模型技術能力評估報告》,它表示對未來的判斷和對現在產品的評價,百度有幸這次獲得絕對的綜合第一的成績。

我們說一下爲什麼這個報告和大家看到的評估報告和其他機構的報告不太一樣的地方。

第一它啓動時間很早,3月份,在我們文心一言跟大家亮相前後,就已經正式啓動了,與海外做相關的評估報告時間是幾乎保持一致的。另外它研究的時間很長,它對於衆多廠商超過4個月的時間,進行了長期跟蹤,這個期間也有很多能力,各家廠商的能力迭代,它報告的內容,也伴隨大家的能力迭代進行調整。

第三點評估最全面,它包括了產品、服務、行業三大維度,12大指標,不僅看參數,更看技術內功和產業落地情況。

這也是大家看到外面很多報告評的,大家試用一下打一個分,這樣不夠客觀,IDC更強調行業落地,它報告評估維度是相對客觀的。

另外就是首次提出,IDC也是首次在行業內提出一套行業認可的技術評估標準,對“百模混戰”的正本清源、去僞存真有一定的借鑑意義的。

被評估,被收納這項報告的廠商,包括百度、阿里,騰訊和華爲被提及,然後是科大訊飛、360、商湯,還有一些創業公司。

我稍微介紹一下三大維度和12大指標,這裡看到的一級指標三個維度,二級指標這裡列出來9個,爲什麼是12個?因爲在行業覆蓋下面有4個行業指標,能源、醫療、工業、金融,這個在不同廠商會有偏差,最多是4個,百度在這裡是4個,其他的一些廠商是一個兩個或者三個,這也是爲什麼獲得行業絕對第一的原因。

大模型強調大模型技術實力和底座能力,第二部分是通用能力,通用能力主要強調在多模態各個模態上的能力。

然後是創新能力、平臺能力、安全可解釋性,不一一介紹了,行業覆蓋考察的是大模型整體的企業級客戶數量,以及落地的行業分佈,在行業覆蓋廣度上來說,百度應該是最爲廣泛的。這裡報告中給出來的圖。大家先看右圖,左圖爲了大家好理解,彙總各家前面排名的幾個廠商綜合的情況。大家看右邊,右邊是報告中原文的百度得分情況,在12個子項中有7項滿分,總分絕對第一,算法模型唯一滿分,行業覆蓋唯一滿分,我用藍色黃色標出的,首先在二級指標中,所有紅色的指標意味着滿分,且第一。所有藍色的指標,雖然不滿分,但是也是第一或者並列第一。在12項指標當中,除了服務能力,在第二位以爲,剩下所有指標,不是絕對第一就是並列第一。

左邊這張圖,我們把排名前4的廠商評分情況彙總到一張圖上,大家看到紅色是百度的評分,最高是算法模型和行業覆蓋,其他的是各家廠商。

這裡援引報告對百度的評價,定性評價是具有長期技術積累,競爭力領先。分兩大類,一個是產品技術,一個是行業應用的評價,分別是文心一言是國內率先推出的對標ChatGPT大模型,集知識增強、檢索增強、對話增強技術創新於一體,效果可圈可點。技術部分我們吳甜總會詳細介紹。

另外IDC很看重百度的一點,百度文心大模型不只是一個模型或者一個產品,它是30多個大模型,涵蓋多個體系。

另外IDC對於百度的四層技術棧有非常強的認可,主要是芯片、框架、模型、應用,四層技術棧獨特優勢,自研深度學習平臺飛槳,有力支撐了大模型的高效訓練和推理。

在行業應用方面,IDC對百度的評價,百度文心大模型源於產業實踐,服務於產業實踐,已經形成支撐大模型產業落地的關鍵路徑,列出了國家電網、浦發、泰康、吉利、哈爾濱市、深圳燃氣、TCL等企業單位,我們也跟他們合作,發佈了涵蓋衆多行業和領域的大模型,加速對行業智能化轉型。

我的介紹就這麼多。後面的時間留給我們的吳甜總跟各位做詳細的技術介紹。謝謝大家!

主持人:今天在場的很多媒體朋友都知道,百度很早就佈局人工智能領域,從文心大模型,也就是ERNIE1.0一直到今天的ERNIE3.5,經歷了多年研發歷程,備受關注的文心一言,也是大模型支持其能力,文心大模型如何支撐文心一言,有哪些應用案例?接下來有請吳甜介紹百度模型算法和技術優勢,掌聲有請!

吳甜:各位媒體朋友大家上午好!今天分享所準備的內容,PPT的頁數還不少,我先從“百模大戰”跟大家聊起來,大家對於國內現在“百模大戰”的現象和狀態非常關心。

首先一點,這個現象表明大的趨勢是所有人都非常認同的。從各種行業報告,我們也能看出來,不斷有分析師給出來AI,尤其是對於生成式AI未來潛在的影響分析。這個分析看得出來,它可能會給我們整個產業結構,甚至於給社會帶來深刻的影響跟變化,現在剛剛拉開帷幕。埃森哲的分析對各個行業現在所開展的工作做了一個比較深度的數據分析,可以看出具有自動化潛力、人員強化潛力,用AI能力可以進一步提升的,從不同行業來說確實不一樣,如果從總體來看,埃森哲給出的數據是40%。這個是針對生成式AI的,實際上AI整體對於產業會帶來多大的影響,過去這些年不斷的有分析,應該說深度越來越深。

第二點,這是階段性的現象。我們今天看到的很多模型層出不窮,在OpenAI發佈ChatGPT之前,真正在做大模型的,不管是企業也好,機構也好,寥寥可數,也就幾家。過去短短的也就是幾個月時間內,大量新的模型出現,這是一個階段性的現象。在演變的過程當中,其實各個企業和機構會逐漸找到自己的定位,下一步逐漸會走向自己細分的方向。

終局會是什麼呢?我認爲對於大模型來說,終局會集中在少量的幾個大模型,有幾方面原因。首先真正從底層做起來的大模型,成本非常高。文心一言它並不是想要做就能做起來的,它需要有多年的積累,需要有非常綜合的能力,也需要有絕對的堅定信心,一直投入下去,才能夠做好。所以從這一點上可以看到,將來只能有少數的大模型。

另一方面,在應用層面未來想象空間非常大。我們還是從這張埃森哲的行業分析可以看到,如果每一個行業都有這麼大的空間,可以通過新的AI技術去提效,相信應用層面的價值,不獲取這些價值,一定會分流。未來是依託幾個少量大模型,會有非常廣泛的應用生態,這是我對整個大的發展方向和大家做的分享。

迴歸到技術來看,它是人工智能技術重要的趨勢,我們一定要先談技術。人工智能時代,IT技術棧已經在發生根本性改變。我相信在座的媒體朋友們,應該聽過不少關於百度的四層技術棧理念的宣傳。我們如果去看一下理念背後的原因,從這張PPT當中可以看到,傳統的IT技術棧是三層,芯片層、操作系統層再加上應用層。在人工智能時代,我們看操作系統層是有細分的兩層,一層是深度學習框架,爲什麼是深度學習框架呢?因爲今天的人工智能核心是依託於深度學習技術的突破,而今天的大模型也是深度學習技術演變發展新的階段。所以深度學習框架起到非常重要的作用,向下和硬件芯片有關聯,向上支撐起模型層再到應用層。而模型層現在我們能看到一系列大模型,在這裡百度有文心大模型,再到應用層,不管在互聯網行業,面向消費者開展的C端產品,還是千行百業各個行業不斷開發出來新的智能應用,這些都是應用層。

百度的人工智能技術棧是四層架構佈局,每一層都有百度多個代表性的領先技術或者是產品。芯片層有崑崙芯,框架層有深度學習平臺飛槳,模型層有文心大模型,還有應用層。

今天主要圍繞飛槳和文心大模型跟大家分享。首先看一下飛槳,飛槳從開源到現在,已經有多年的發展歷程,在過去幾年飛槳的生態有快速蓬勃發展。飛槳平臺建設本身,是本着支撐產業級應用,所以飛槳平臺有核心框架,也爲使用者提供模型庫、開發套件、各種各樣的工具組件,以及有實訓社區,所做的這一切,都是爲了讓深度學習開發門檻降到儘可能低,這樣才能支撐起應用層大量的創新工作。

最新的數據顯示,飛槳平臺上已經有750萬開發者。這個數據不太容易對比來看,拿一個在工信部有參考價值的調研數據來看,中國的軟件從業人員大約是800萬-1000萬,軟件從業人員和深度學習開發人員有很大的關聯,但不完全一致,從這個角度,我想說750萬的AI開發者已經是非常大的開發人羣,現在在各行各業裡面的AI開發,深度學習算法開發已經非常廣泛了。

再看文心大模型,文心大模型百度從18年開始開展相關的工作,在19年3月份,正式的向公衆發佈了文心大模型1.0。19年3月16日,到今年3月16日,正好都是3月16日,依託文心大模型的技術積累,百度發佈了文心一言。文心一言是以文心大模型作爲基座模型開發的技術系統,它的能力對標的是ChatGPT。

在23年5月份,我們也上線了新的底座模型,文心大模型3.5。大家今天看到的外界的評測,以及剛剛分享到的IDC的評估,都是在文心大模型3.5作爲基礎模型的新的文心一言系統。我在這裡非常不謙虛的說,新的版本文心一言能力已經超出ChatGPT 3.5,這也是在我們國內開展相關技術工作是重要的里程碑。剛纔和大家分享到的IDC的評估分析,與IDC有過交流的朋友們,應該知道IDC是非常客觀中立的分析機構。我們也和IDC有多年的合作,在整個合作過程當中,非常深刻感受到IDC一直在以第三方的視角,在給各個廠商做客觀的分析。

剛纔說三個指標很重要,第一個是總分。總分代表的是綜合能力。第二個是算法模型,大模型最關鍵的兩件事,一件事是基礎要好,扛得住各種各樣應用要求的內核能力,所以基礎算法會非常重要。另一個在應用層面,因爲我們不是做一個實驗室產品,還是需要讓大模型飛入千行百業,在應用層面的行業覆蓋也是它的核心能力體現。所以剛纔我們的同事跟大家分享了,最關鍵的三個數,一個是總分,一個是基礎算法能力,一個是行業應用。

文心一言,從技術來看,這張圖能代表文心一言整體技術的思路。最重要的是預訓練大模型,我相信大家過去幾個月有了解到一些技術詞彙,比如說SFT、RLHF等等,這些工作在整個大語言模型建設過程當中,如果我們從它所投入的時間、資源、精力消耗來說,預訓練大模型是佔到絕對的大頭。我們從最開始訓練,到能夠產出完整的模型,基本上90%的時間是花在怎麼樣把好的基礎預訓練大模型做好。剛纔說到文心大模型3.5是全新預訓練大模型技術。

所有的大語言模型都是在通用技術底部,剛纔說到了SFT,如果把預訓練模型類比成已經看過很多書的孩子,最容易讓我們有直觀感受的是它的智能水平到底怎麼樣,如果看成預訓練模型,有一些精調的過程,更像是老師在指導預訓練模型對齊到人所希望的它能做的一系列事情、一系列工作,給予它指導,讓它能夠做好。

人類反饋的強化學習,很像是不斷讓大模型在做題。在這個過程當中,告訴它哪些對,哪些不對,這是一個練習的過程。還有很重要的是今天我們看到的大語言模型,通過提示的方式,可以非常有效的讓他按照我們希望的方式來回答問題。所以在提示方面,如何通過更好的提問,教會這個孩子怎麼樣回答的更好。這裡不僅僅提示,包括能夠體現出邏輯性的思維鏈的學習。這三部分表現下來之後,一個基礎的大語言模型就形成了。百度在開展文心一言研發的時候,並不只是復現和別人一樣的大語言模型,在我們看來,大語言模型要實用化,有問題要能解決,這個問題主要體現在對事實性的諮詢。我們知道大語言模型容易產生幻覺,這個幻覺用到實際的應用場景當中,它可能帶來的危害不好估量。所以怎麼樣能夠把事實性提高,怎麼樣把它的時效性提高?我相信大家試過ChatGPT也會發現,它有時候回覆說,我的訓練數據是截止到某年某月某日之前的,當然真正使用的時候,就會需要它能夠對最新的信息跟數據有反應,這是從實用化角度很重要的要求。

所以百度在剛纔和大家分享的這些技術的基礎上開展三大增強技術,我們叫知識增強、檢索增強和對話增強。

首先和大家分享知識增強,在知識和數據當中進行學習,對於大模型來說,我們還可以對比人,人如果用知識結構,知識體系的方式進行學習的話,學習效率是更高的。學習效率更高就意味着同樣規模的模型,可以有更好的效果。所以我們從知識當中,從一些專項的數據當中去進行融合學習,開展知識增強的技術。百度積累的知識圖譜現在已經有5500億事實,但是真正應用於大模型的還有大量的數據,不一定完全結構化的數據。通過讓模型內化學習,通過數據的構造、語義的學習,學習到模型自身的參數當中,也通過知識外用的方式,比如說知識推理、提示構建等。模型使用的時候,能夠非常穩定的達成,滿足使用者的需要。

第二方面,是檢索增強。檢索增強解決的問題,剛剛我跟大家分享到的是時效性的問題。信息的時效性怎麼解決?最佳的方法就是通過對於最新的信息和數據,能夠通過搜索的方式來滿足。文心一言系統採用了新一代檢索架構,這是基於大模型端到端的檢索架構,是極簡化的檢索,充分發揮了大模型自身的能力。並且,這樣一個檢索架構和生成架構之間,因爲是大模型和大模型之間聯動的優化,可以達成最好的效果。

第三方面,是對話增強。因爲模型跟人現在是以對話的形式在交互的。而對於使用者來說,對話這種交互方式是最自然最天然的方式。我們通過記憶機制,上下文理解,對話規劃這樣的技術,在增強對話的連貫性、合理性和邏輯性。

我跟大家分享的這些點,如果觀看過3月16日百度文心一言發佈會的話,會知道我們的CTO王海峰博士已經把文心一言整體的技術框架和大家公佈。但還不止於此,我相信大家有持續跟蹤文心一言效果能力的話,應該明顯發現,從3月份到現在,文心一言能力有非常大的提升,這個提升應該說使用過的話,都能明顯感覺到有非常大的變化,這個得益於文心大模型3.5的支撐。文心大模型3.5在技術上,除了文心一言基本的技術框架之外,也有新的技術突破,主要有五個方面:

首先是基礎模型的升級,基礎模型的升級跟飛槳最先進技術的支撐是非常相關的。這裡和大家分享兩個單點,一個是採用了飛槳的自適應混合並行訓練技術,所謂自適應混合並行訓練技術,因爲大模型參數規模非常大,怎麼樣能夠讓這樣大規模參數的超大型網絡,非常有效率的運行起來,其實要進行大量並行計算工作,這裡的並行是不同角度,可能有參數的並行,有數據的並行,有流程調度的並行,還有模型自身結構上的考慮等等,所以我們叫混合並行,而且需要結合模型在訓練整個過程的不同階段,以及我們訓練集羣的狀態去進行適應的調配。另一方面是混合精度計算。在不同階段,以及面對訓練當中不同訓練要求的時候,如何去採用。這些帶來的好處是什麼呢?文心大模型3.5的訓練效率提升兩倍。兩倍跟其他的數據相比較不算很大,但實際上一個這樣的大規模模型訓練,基本上是大幾個月,訓練效率提升兩倍就意味着能夠時間上折半,半年能變成一個季度,一個季度變成一個半月。那它帶來的影響就非常大了,使得在有限的資源下能夠去訓練出更好的模型。

關於這個模型本身升級,我們做了大量對於數據源的優化,數據分佈的優化來保證模型效果和安全性。我們都知道模型的安全性很重要。因爲生成式AI,它生產出來的內容會給我們的使用者閱讀,模型如何能夠符合我們所希望的價值觀,能夠穩定、正向的給它生成結果,是非常重要的。所以,安全性也是文心一言建設中很重要的建設方向。

下一個是模型的效果本身和場景適配能力,在文心大模型3.5上進一步提升。這裡有監督精調,考慮多類型多階段的訓練。在強化學習方面,有不同層次、不同粒度獎勵模型的設置,獎勵模型也很重要,因爲獎勵模型可以指導模型,總是能穩定的給出最好的方案。此外訓練當中對於多損失函數混合優化,以及模型在提供服務的過程當中是有數據飛輪的。我們雙飛輪(大飛輪、小飛輪,)的結合,使得文心一言在有條不紊的節奏當中去進行優化。

下面跟大家分享的是知識點增強,知識點增強帶來了非常顯著的效果,這塊的工作最主要的目的是提升大模型對世界知識的掌握和運用能力。通過用戶的提示和需求輸入之後,對此做理解,從中去抽取和擴展知識點,通過搜索引擎和知識圖譜的幫助,把知識點變成指導大模型生成工作之後的指引,最後是非常可控的讓模型能夠給出富有知識,尊重事實的結果。

還有對於邏輯推理、數學計算以及代碼生成等能力。這塊大家有持續使用的話,應該能感覺到三個多月時間,這個應該有非常大的變化。在這裡構建了大量邏輯推理知識,也進行多種方法來綜合,最終實現了文心一言現在數學能力非常出色,代碼能力我相信大家試用的話,也可以感受到,也有非常明顯的變化。

還有一個是插件。文心一言畢竟還是大語言模型,大語言模型某種意義上講是“思維機器人”,因爲語言承載我們的思維,大語言模型擅長的,可以通過語言的方式把思維呈現出來,但是也有不擅長的地方,不擅長的地方怎麼辦呢?通過插件的機制,可以有效的把大模型能力擴展開。我們在建設插件機制,目前已經有兩個插件在文心一言產品上大家可以用到,一個是百度搜索,另一個是ChatFile,就是長文檔的分析處理能力,未來也會持續建設文心一言上的插件,以及開放給開發者來使用。

總體來說,文心大模型3.5,在模型效果上對比3月份版本提升了50%,訓練速度提升了2倍,還有很重要的,也得益於飛槳文心的聯合優化,推理速度提升了30倍。速度提升對應的是成本的下降,在大量的使用場景,能夠非常好的應用起來。

有一些例子可以跟大家分享,這是生成標題的案例,可以看到文心一言根據要求給出來了多個標題,當然這個標題可以供我們使用者再去篩選。還有像生成觀點,分析和總結。這是大模型很擅長的地方,它對於觀點分析和總結都是非常強的。

這是生成新聞稿,這是很長的一篇文章,所以錄了一小段,可以給大家看一看。以“促進大學生就業”爲主題寫一篇新聞稿。我們看它的行文規範都非常好。大語言模型本質上是語言模型,它在語言的流暢度和用語的規範角度來說,有天生的強項。它還可以生成視頻。我們可以先讓模型來生成一段用於做視頻的文字,再讓文心一言來把這些內容轉成視頻。

(播放視頻)

生成視頻的能力,會在不久後以插件的形式開放給大家使用,現在是在百度內部進行內測。

剛纔說到長文檔摘要和問答。我們也可以看一看ChatFile插件的使用。先上傳一個文檔,上傳文檔之後,可以對這個文檔進行摘要,進行問答,還有潤色等等一系列的工作。這個大家可以在文心一言頁面上試一試。

文心一言在百度自己內部場景,這幾個月時間已經很多場景應用起來了,我舉個例子,一個是智能辦公,這個在百度自己的辦公環境已經在使用,比如說讓大模型幫助工作文案的寫作,還有任務執行。這是非常有意思的一個功能,在百度內部的辦公交流工具如流上,我們幾位同事一起討論一個工作話題之後,可以請大模型做智能總結,這個智能總結的功能,內部使用率還是很高的。有沒有發現大模型總結的,比很多人總結的水平還要更高一些。

還有在會議當中的,我們在開會的時候,會有7×24小時的AI助手爲大家服務,它做什麼呢?做幾件事情。一個是會切分整個會議的議題,比如說一小時的會議,它會根據這一小時會議當中正在討論的議題,實時給出議題的總結。相當於把會議的議題切了段,切了段之後,會給議題總結出標題,還有AI洞察的功能,給這個議題的總結,最後形成會議紀要是非常快速的,我們同事只要稍加整理就可以使用,提高了工作效率。

還有編程,百度工程師每天的編程工作量非常大。基於文心一言,現在已經在公司內部大量使用,可以更快更好更簡單的進行代碼寫作。

這是兩個已經在應用的,還有其他的,今天時間的原因,不再一個一個分享。

今天還想和大家聊一個話題,關於大模型的產業模式。我相信也是大家都非常關心的問題。我們能看到大模型能帶來的各種各樣的變化,真正在產業當中形成價值,依然還有一些我們需要去探索的路徑。

我們先看挑戰。大模型產業化面臨着挺大的挑戰。總結起來有三方面:

首先是大模型的體積確實很大,模型大帶來的訓練難度高,成本高。第二,對於算力規模要求非常大,性能要求非常高。第三,數據規模也很大。我們今天爲什麼有這麼多千億參數規模,甚至也有萬億參數規模呢?它也跟海量的數據上自定義強相關。數據的規模也非常大。收集、挖掘、建設、篩選這些數據,清洗這些數據本身也是非常大的大工程。

回到最開始說的,未來終局來說,其實完全不要存在大量的大模型,而對於應用者來說,也不需要每一個應用都來進行大模型的開發。大模型產業模式,如果我們來對比讓大家可以直觀想象的話,可以類比芯片代工廠。現在芯片的型號、廠商非常多,但是代工廠只有幾家而已,芯片代工廠價值非常大,它做什麼呢?把成本高的設備和產線,還有精密的工藝流程,還有本身生產過程進行封裝。整個社會不需要有非常多的企業都來實現這個能力,只要少數幾家芯片代工廠,對於有芯片生產需求公司來說,只要出生產方案,交給芯片代工廠生產,就可以得到想要的芯片。如果沒有代工廠的話,都無法想象是什麼樣的狀態。大模型也是一樣,這在大模型的本質和性質上是非常相似的,大模型平臺是價格昂貴的大算力系統,可以把大數據、大算力、大算法都封裝,並且可以建設自動化、數字化、標準化的的生產模式。應用方定義好問題,抽象好之後,把對AI模型能力要求,可以交給大模型平臺,由大模型平臺進行生產,最後遍地開花纔有可能實現。所以我們把這幾個路徑,大數據、大算力和強算法通過開發訓練的過程,封裝給大模型平臺,千行百業都可以來使用。千行百業都使用的時候,相當於享受到了大模型提供廠商高智力水平的技術,就能高效支撐起千行百業的應用。

百度一直在踐行這樣的理念。去年百度和11個行業當中的龍頭企業機構,一起聯合發佈了行業大模型,行業大模型的機制也一樣,在通用大模型基礎上,加入行業自有的數據知識及專家經驗,生產出來的新的模型,在行業當中有更好的適配性。

所以今天可以看到,大模型已經在這條路上賦能千行百業。相信也會未來能夠帶給產業升級巨大的支撐作用。

我今天跟大家的分享就到這裡。

謝謝大家!

主持人:感謝吳甜總非常精彩詳細的介紹。剛纔講到我們今天也是給大家分享一下,包括IDC整個對於我們這樣一個報告的體現,行業比較認可的技術評估,是非常重要的,包括技術評估也推動大模型行業深度融合,接下來我們有一個媒體問答環節。可以跟現場的各位老師進行交流,請現場有問題的老師可以舉手示意。

記者:吳甜總你好,我是中國日報記者,有一個問題想問您,您剛纔提到百模大戰的終局是隻有幾家勝出,百度如何保持自己的競爭優勢呢?

吳甜:剛纔跟大家分享的內容已經涉及到了。首先在模型建設上,是非常高壁壘的事情。模型建設首先百度持續有積累,同時自身也有非常堅定的投入。所以基礎的模型本身就是能夠保證先進性最重要的基本點。另一方面是應用。應用角度來說,百度自身有多項強有力的業務來支撐這一點,也有相應的模型應用生態,這一系列的保障,從底層的模型到應用,是全方位的建設。

記者:吳總你好,我是百姓網的記者,我的問題是百度被授予了國家人工智能標準化總體組大模型專題組聯合組長單位,我想問一下百度在人工智能標準化工作當中發揮什麼樣的作用呢?

吳甜:百度作爲聯合組長單位,這是非常好的事情,大模型產業化標準也是很重要的一件事情。百度作爲聯合組長,在大模型核心技術研發,產業應用、生態建設方面希望能夠積極發揮一些作用,也是積極去投入到推動大模型標準化的頂層設計上,以及相應標準規則的研製,在這方面百度自己本身就是重要的從業者,也有一手的實踐經驗,積極參與到標準當中,希望推動大模型產業的發展。

記者:吳甜總你好,中國婦女報記者提問,我有兩個問題,咱們文心後續的產品發展把重點放在哪些方面?第二個問題,我們看到文心的團隊有很多女性科技工作者,包括您也是,我想問一下女性在研發過程中,都貢獻了哪方面的力量?如果方便的話,可以舉一兩個例子,講個故事之類的。

吳甜:文心一言下一步的發展有幾個方面,首先這是從基礎能力上來說,是往通用能力發展重要的產品。所以在基礎通用能力提升上,會持續的進行,到目前來說,現在效果很好,但依然沒有達到我們對它的最高期望,這裡頭還有大量的工作需要去開展。還是類比到人的話,給社會一個智商、智力水平足夠高,綜合能力足夠強的,可以到社會上供職的AI,這是很重要的大的目標。

第二方面,我也一直和大家分享的就是應用,應用的實用化,是現在新技術帶給大家價值的重要方面。所以文心一言建設過程當中,從我剛纔分享中能看出,我們很多方面的建設是考慮了它如何實用化,以及如何能夠跟我們千行百業重要的場景能夠有更好的發揮價值,這個會去建設,這也會是重點。

文心一言團隊確實有女性工作者,這個不是文心一言團隊,本身百度技術團隊女性的佔比並不算低,百度女性技術工作者和男性技術工作者有非常好的協作,共同創新。個例的話,就不在今天這個會議上分享了。

主持人:時間關係我們問答環節就告一段落,那麼我們AI大模型技術能力評估報告媒體交流會到此結束。