蔡崇信力挺,老將王堅迴歸,阿里雲衝刺百模大戰

文|《中國企業家》記者 鄧雙琳

編輯|李薇

圖片來源|受訪者

今年的雲棲大會,有多位老將又出現了。9月正式上任的阿里巴巴集團董事會主席蔡崇信、CEO吳泳銘,將上任後的第一次公開露面放在了阿里雲,而傳聞中已經迴歸的“阿里雲之父”王堅,也以阿里雲創始人的身份出現。由此可見阿里雲在整個阿里巴巴的戰略重要性。

對阿里雲而言,今年是“動盪”的一年。

年初,張建峰卸任阿里雲總裁,由當時的阿里董事會主席兼CEO張勇兼任;隨後,阿里宣佈開啓“1+6+N”組織變革,阿里雲從集團母體完全分拆,並計劃在未來12個月內完成上市;一個月前,張勇卸任集團職務的同時,宣佈同時卸任阿里雲董事長與CEO,交由吳泳銘接任。

而機遇也總是與挑戰並存,在一年曆經三度“換帥”的同時,阿里雲也迎來至關重要的發展機會——AI大模型的火爆,進一步助推了阿里雲的想象力。

距離ChatGPT發佈一週年還有一個月的時間,科技巨頭們又開啓了新一輪大模型競速,阿里雲的大模型戰略也比上半年變得更加清晰:堅定站在雲計算的出發點做大模型,建立AI時代全棧的雲計算體系。

阿里雲集團首席技術官周靖人表示,2009年阿里雲就提出“數據中心是一臺計算機”的理念,今天,AI時代更加需要這樣的技術體系。作爲一臺超級計算機的雲計算,可高效連接異構計算資源,突破單一智能芯片瓶頸,協同完成大規模智能計算任務。

雲棲大會當天,周靖人宣佈升級AI基礎設施,併發布了一系列產品。其中包括千億級參數大模型通義千問2.0、八款行業大模型、大模型應用開發平臺“阿里雲百鍊”。據瞭解,相比4月發佈的1.0版本,通義千問2.0在複雜指令理解、文學創作、通用數學、知識記憶、幻覺抵禦等能力上均有顯著提升。

目前,阿里雲已開源通義千問7B、14B版本,周靖人表示通義千問72B模型即將開源,將成爲中國參數最大的開源模型:“目前,中國有一半大模型企業跑在阿里雲上,280萬AI開發者活躍在阿里雲魔搭社區上,未來,阿里雲將攜手千行百業推動AI創新,共享技術紅利。”

阿里雲集團首席技術官周靖人、阿里雲副總裁張啓在雲棲大會期間接受了媒體的採訪,以下爲採訪實錄(有刪減):

問:在大模型時代,阿里雲的角色和定位是什麼?

周靖人:在AI時代,阿里雲的定位是服務好各種各樣在AI時代的創業者、開發者,包括企業客戶等等。

今天,雲所面對的客戶分了很多階層,有的可能來自於模型創業公司,他們更希望的是使用到最先進的AI基礎設施,能夠幫助他們去做模型的創造,去做大模型的研究;還有一類客戶,是希望能夠把已有的開源模型,有效結合自己的產品做二次創新;還有的客戶,希望把通義千問的能力,或者把整個應用模型包括星塵、點金的能力,通過簡單的API包裝能集成到自己的業務體系裡來。

問:阿里雲和國內頭部大模型開放公司有沒有一些合作的想象空間?

周靖人:有非常多的合作空間,比如百川智能是阿里雲一個重要的客戶,也是一個合作伙伴。包括智譜AI和國內其他模型創業公司,都是我們AI基礎設施重要的一個用戶。

我們有各種各樣的客戶,他們有不同的技術能力,有的支撐技術能力很強,更多是希望把相關已有的模型應用在自己現有的系統裡,我們對不一樣的客戶有不一樣的解決方案。阿里雲是提供一個完整的產品技術框架。

問:現在整個算力受到一定的干擾,有些雲廠商在美國政策出來之後優先供應自身內部的需求,而不是對外提供。阿里雲作爲國內最大的一家雲廠商,在短期內算力問題無法得到緩解的情況下,會不會更多傾向於支持自身模型?

張啓:我相信所有中國廠商短期內都會碰到這個問題,我們也會做各類準備。2009年阿里雲成立的第一天,王堅提出三句話,互聯網是基礎設施、數據中心是一臺計算機、計算會成爲公共服務。

阿里雲成立的第一天,就是把更便宜的、性能更低的、各個層面更便宜普惠的PC機成百上千,甚至幾十萬上百萬地連接起來,讓它提供更強的算力,能夠去做更大的計算任務突破。

今天面臨同樣的情況,在未來的一段時間裡,大家可能都面臨沒有很強的單芯片性能的情況。這個纔是雲計算真正要發揮價值的地方,它就是要把成千上萬,十萬上百萬異構的芯片連接起來。單一芯片性能可能不行,但整體上能通過並行計算實現任務。

周靖人:首先,阿里雲一定是個開放的平臺,我們和各個公司都有緊密的合作。當前我們遇到的挑戰是產業化的挑戰,需要一起攜手去面對,而且阿里雲也是在底層技術方面通過異構化的能力,通過並行化的能力,在不斷地進行創新和突破。我們的目標是爲每一箇中國的AI公司提供足夠的算力,這個方向沒有變化。

問:阿里雲推出了很多模型產品,現在也有很多AI應用廠商,阿里雲如何考慮和他們的關係?阿里雲的模型產品是to B、to C都做嗎?

周靖人:我們並不是做一個to C的產品,我們更多希望把模型的能力開放出來,能夠讓更多開發者、合作伙伴去使用。所有的模型都會以API的形式,把模型的接口開放出來。

我們講雲上的開發者,不能只關注雲上的創業公司,我們還會面對更多模型應用的開發者,這是一個不可忽視的羣體,人工智能產業要獲得成功,一定要讓這樣一羣人發展起來。

問:這一次發佈了很多通義大模型下的行業應用模型,它和阿里其他團隊關係怎麼樣,比如通義萬相的寫真館,和前段時間比較火的AI相機比較像,會不會有競爭關係?“1+6+N”之後,阿里雲跟其他兄弟公司的合作關係會不會有些變化?

張啓:據我所知,目前國內第一個大規模落地的AI應用應該是在通義千問發了之後,釘釘進行全面的改造。前幾個月淘寶也在測試淘寶問問,夸克也做了非常多大模型方面的嘗試和進展,阿里國際站也在大模型方面進行了很多探索,各個業務都在自己的方向摸索,現在還是一個非常早期的階段。

周靖人:整個阿里大集團在模型上的創新和探索非常多,當然不同的創新、不同的應用正處於不同的階段。有些可以對外發布,像剛纔講到的釘釘,有的還在探索和適配中。

我們之所以做(通義萬相)這個模型,初衷不是做一個to C的產品,是希望把能力能夠釋放出來。我們希望有更多妙鴨相機的公司在阿里雲上面能夠發展起來,能夠獲得成功,妙鴨相機本身模型服務也是基於阿里雲PAI靈積的平臺。

我們今天是一個模型的展示,但並不是一個完整的應用。爲了要把模型的能力應用在整個業務系統裡,還需要進行開發。我們希望有這樣的能力,其他的開發者也許不具備模型能力的創新,或者不願意在這方面花時間的話,他可以用這樣的模型集成在自己的業務體系裡。這個不存在任何衝突,也不存在任何競爭的關係。

問:通義千問2.0在阿里雲大模型研究歷程中處於什麼位置?如果對標ChatGPT,通義千問2.0現在屬於什麼水平?

周靖人:我們在大模型這方面的研究,從2018年底、2019年初就開始了,那個時候我們還叫預訓練模型,今天通義千問的模型就是在之前整個預訓練模型的技術體系裡面發展起來的。所以,我們是有相當的技術積累。

阿里雲集團首席技術官周靖人。

從4月份開始對外發布以後,通義千問進行了一系列升級,通義千問2.0是個千億級規模的大模型,我們的目標一方面是開發產品本身,更重要的是我們把這個大模型以API方式開放出來,能夠讓更多人使用,至於模型能力部分,我們也做了很多測評,比較客觀地驗證通義千問2.0的能力。

在模型的評比裡面,通義千問2.0比ChatGPT3.5來說有非常大的勝率,在ChatGPT4.0裡面大家各有勝負。我相信最好是用戶來做一個評價,大家可以去嘗試,給一個判斷,本身這個模型也在不斷地演進過程當中,每個人的體驗是不一樣的。

即使回答同一個問題,有的人覺得模型A不錯,有的人覺得模型B不錯,其實很大程度上模型反饋質量好壞也是個性化的體現,這個是我們接下來面對的一個技術問題,怎麼能夠找到大家個性化的需求,能夠幫助大家個性化地去定製相關的模型。

我們認爲,(大模型)都還在技術發展過程中間,距離任何一個定論都爲時尚早。而且整個這個領域發展得非常快,每個月大家都在進步。接下來我們還有更好的模型推出,也敬請關注。

問:大模型對開發範式的改變是怎樣的?

周靖人:雖然我們很關注模型,但模型是業務系統開發的一環,也希望媒體不能只關注模型,還有很多數據,特別是數據庫、存儲等一系列的能力也是做科技創新所必需的。我們看到了幾方面:

一方面是serverless(無服務器計算),阿里雲在這方面引領這個領域的發展,積極去推出一系列serverless的產品。幾乎今天所有的產品體系都有serverless的產品提供,更重要的是幫助大家降低了使用雲的門檻,能夠讓大家用新的方式去使用雲。

二是容器,這次我們推出了ECS阿里雲容器服務,更進一步去應對更加趨於容器的開發範式。今天所有開發者是大量使用容器,如果和雲能夠有效地結合起來,能夠幫助大家快速去部署,能夠幫助大家在各個產品之間資源的互通、資源互相調動。

三是流程式的開發。今天所有的系統開發已經不再是使用一個單一的產品,說我使用一個大數據,或者使用一個數據庫就結束了,往往前端是數據處理,後端是模型的應用等,很多複雜的產品體系要融合一起使用。同時,我們之前講到Model as a service(MaaS,模型即服務),它既代表了架構上的升級,也代表了圍繞着模型的一系列的範式轉移。今天開發的模式更多是以模型爲中心,也就是說模型類似於一個半成品,或者一個重要的生產因素,有了這個模型,可以很好地提供給其他業務系統的開發者使用。

問:阿里雲大模型目前投入的成本是怎樣的?對未來的商業化有什麼考慮?

周靖人:我們的目標是要服務好每一位的開發者或創業者,進一步地幫助大家能夠降低使用AI的成本。所以我們纔會做到今天模型的開源,包括基礎設施特別是在模型推理方面的工作,不單是提升整個延遲各個方面的性能指標,同時能夠降低使用模型推理的成本。我認爲在這方面,還有大量的工作需要做。

我們的目標是要把模型推理的成本能夠再降幾個數量級,讓更多的應用開發使用到AI的能力。就像我們一再講降低用雲的門檻一樣,我們也希望能夠降低使用模型的門檻。

問:我們的客戶集中於哪些行業或者哪些場景?如何保證數據安全的問題?

周靖人:今天各行各業對大模型的熱情,應該說都在快速的升溫過程中。我們今天很難說哪一個行業沒有對大模型產生非常大的興趣。

企業使用模型時的數據安全問題,我們從4月份發佈的時候就強調過。阿里雲百鍊平臺,背後依賴的是整個阿里雲對數據的安全管控。也就是說,今天在阿里雲上面去創建這樣一個賬號,所有的數據是安全的,是沒有人能夠觸達到的,而且相關的企業級數據是不用於模型的訓練的,只用於今天針對於企業的模型的微調。所有的這些數據並不會用於基礎模型的訓練。

我們通過百鍊這個平臺,加強每一個流程包括審計各方面的能力,能夠更有效地幫助企業去使用模型。當然我們也提供各種各樣部署的方案,我們也理解有一些企業需要把模型部署在一個特殊的場景裡面,我們也提供相關的支持,能夠有效去配合它的業務需求。

問:雲計算服務本身和大模型之間的強強結合,到底對雲服務上量能起到什麼直觀的作用?

周靖人:其實這次AI技術變革背後實質是一個技術體系全面的升級。它表面上看起來是一個模型方面的事情,其實背後是雲計算技術的方方面面,甚至可以說是計算機科學技術全面的升級。

這是一個非常有趣的現象,特別是對雲廠商的公司,要既懂AI,又懂雲計算,才能在這次競爭裡取得一個重要的戰略性優勢,這也是爲什麼微軟從它的財報看起來能夠在雲計算競爭裡脫穎而出,因爲有OpenAI和Azure的加持。如果今天AI能力和雲計算能力沒有有效地融合在一起,很大程度上是不利於AI產業以及雲計算的發展。

這方面正好是阿里雲一個獨特的優勢,我們既有歷史悠久、規模強大的雲計算,也有非常前瞻的一系列AI研究,包括當前模型一系列的研發,以及整個開源的生態。

我們認爲,大家一定要給這個領域一些時間。國內來講,是從今年3、4月份開始,大家才陸陸續續發模型。在這方面,我們的確是比海外要晚,海外還是經歷了至少一年的先發優勢,甚至更長的時間。

我們也在快速地追趕過程中。短短半年時間,模型的生態已經開始慢慢發展起來了。模型的生態發展起來,一定代表了算力也發展起來。