第四範式戴文淵:企業智能化轉型的“1+N”模式

【本站智能訊 6月4日消息】近日,第四範式創始人兼CEO戴文淵在IDC“CXO卓越圈”活動上,針對人工智能推動企業數字化轉型提出了自己的看法:隨着人工智能規模化落地,企業在制定AI轉型路線時可考慮“1+N”的應用場景模式,“1”是結合公司核心業務,把1個或幾個對業務影響最大的場景做到極致;“N”是用最高的效率規模化落地儘可能多的應用場景,使場景的總體價值最大化。

以下是戴文淵主題演講全文:

人工智能在今天是一個特別火又特別令人困惑的話題。火是因爲被各行各業寄予厚望,困惑是因爲目前公衆在新聞媒體上看到更多的AI集中在感知層,例如人臉識別、語音識別、無人車等。但回到我們的企業經營,似乎和無人車這樣的技術完全聯繫不到一起去。享受着AI紅利的企業,例如BAT,也沒有哪家是靠人臉識別在經營的。第四範式一直致力於解決的問題,是如何把人工智能技術和各行各業企業的生產、經營能夠結合起來。一個企業、一個組織,通常自上而下分爲戰略制定者、策略制定者、策略執行者三種角色。過去20年,互聯網和移動互聯網解決了策略執行的環節。未來的20年,人工智能將會通過改造“策略制定”的環節來提升企業業務。

首先我們需要關心的是企業需要提升什麼業務價值。

首先,每個企業可能都會有1個或多個核心業務,這些業務提升會帶動整個企業的提升。例如,最近幾年,互聯網應用越來越關心的“千人千面”,本質上是通過個性化服務應用提升客戶活躍度,降低客戶流失率。客戶活躍度的提升,會帶動企業整體的提升。對於零售或製造業企業,提升供應鏈效率,降低成本,也會帶動企業核心競爭力的提升。面對這些核心應用場景,我們需要AI做到“極致的效果”,因爲每提升一個百分點的效果,對企業都至關重要。

其次,很多企業也往往面臨場景應用極其分散的情況。例如,大型金融企業,他們的業務往往較爲分散。這種情況下,AI的規模化落地,往往比單場景的極致效果對企業更爲重要。假設一個企業有一千個場景,其中一個場景提升10倍,對整個企業來說,只有百分之一的提升。而如果我們能高效地完成一千個場景的全面覆蓋,即使每個場景只提升1倍,那也百分之百的提升。所以,面對場景衆多的企業,AI的規模化落地能力是企業智能化轉型的關鍵。

我們習慣把企業的核心場景稱之爲“1”,把衆多場景稱之爲“N”。通常企業的智能化轉型需要一個“1+N”應用模式。這裡需要指出的是,“1”不一定只有一個應用,有些企業可能會有若干個“1”這樣的核心應用,但一定不會很多。

企業的業務一定是和企業的發展目標相關的。例如,我們服務某知名國際零售集團,根據企業的發展目標,將其業務分爲“開源”和“節流”兩大類。“開源”的目標主要和客戶相關,包括提升客戶留存率、單客戶價值、平均客戶留存時間等。手段上來說,可能有千人千面的推薦、coupon的營銷等。AI在裡面可以通過優化推薦、營銷等環節,提升留存率、單客戶價值等核心指標。“節流”的目標主要是降低中後臺運營的成本和提升運營效率。通過提升供應鏈等環節的效率,降低成本,提升企業的競爭力。這其中,個性化服務、供應鏈是核心應用,是“1”,1個百分點的提升就足以改變企業的競爭格局。而衆多細分場景,如各種單據的OCR、各種場景的語音識別、智能客服、流程機器人等,是“N”,規模化的落地可以提升企業的整體效率。

“1”一定要做到極致的效果,這類標杆型應用對於AI系統的要求較高。一是高維,也就是精細,越高維度的AI,其效果上能做到越精細。過去的專家模型,往往維度(規則數量)在幾個到幾千個不等。傳統意義上的高維模型,往往侷限在萬級別的維度以下。第四範式開發的高維機器學習引擎,最高已經支持到萬億(10^12)維度。二是實時,隨着服務線上化以及對極致體驗的要求,對業務的實時響應要求越來越高。尤其面對高維,我們發現往往過去能做到實時的系統,做不到高維;能做到高維的系統,做不到實時。而AI在業務場景的運營中要做到極致,需要實現高維模型的毫秒級響應。三是閉環(自學習能力),任何系統都不可能完美,都可能會犯錯。我們更怕的不是AI犯錯誤,而是AI持續不斷地犯同樣的錯誤。因此,持續利用業務應用過程中的反饋數據進行系統自我更新與優化的能力,是未來AI系統極其重要的核心能力。我們也經常發現,AI系統的最大提升,很多時候並不來自於系統上線的那一刻,而是來自於上線以後經年累月的自我迭代提升。

“N”追求的是規模化落地,現在我們服務的很多企業都面臨着“全面AI改造”,在面對1千個甚至1萬個場景時,如果每個都做到極致,代價和效率是不夠的。實現規模化落地和極致效果的路徑不完全一樣。首先需要建立一個統一的方法論,讓更多人用統一方法規模化生產AI。以我們服務的某大型央企爲例,其開發者數量衆多,AI開發者卻非常有限,我們爲其提供了統一的方法論和平臺,讓開發者針對業務目標,在平臺上面按照既定步驟開發各種各樣的AI應用。

其次,AI規模化應用過程中要有完善的數據治理能力,尤其是對於大中型的企業,數據治理非常重要。可能我們過去已經做了大數據系統,但往往是面向BI建設的,BI大數據主要是幫助人去總結一些經驗,因此更強調查詢、統計、可視化等功能。AI大數據是給機器看的數據,需要的是完整、實時和支持機器自學習的閉環。兩個大數據系統的設計理念天然不同,我們經常會看到企業由於過去建設了面向BI的大數據系統,又將AI建設在這個系統之上,非但沒有幫到AI,反倒成爲AI落地的障礙。因此,大規模AI實踐過程中企業需要一套面向AI的數據治理系統,能夠存取PB級甚至更大量的日誌、支持實時存儲、形成一個線上數據採集和處理的閉環等。

最後是AI算力,以往大家關注的焦點主要集中在兩個方面:一是通過購買大量的服務器和GPU來提升算力;二是通過芯片實現AI的加速。但是算力是一個完整的體系架構,甚至不僅僅包括硬件,而是軟件和硬件的“結合體”,只有瞭解AI算法的運算架構與邏輯,才能針對硬件去做深層次的優化。AI系統其實是有“套路”的設計,具備固定的計算模式,它需要的是一個專用計算,不像大數據和軟件需要的是通用計算。基於專用計算的特點,算法和軟件其實可以直接定義好計算,提前把計算的部分去硬件化。此外,過去傳統的通用通信協議、存儲系統也同樣面臨着無法支撐AI的困境,需要針對於AI算法的特性進行深度優化。以TCP的通信協議爲例,該協議通過“三次握手”建立可靠的數據交換機制,保證數據傳輸不丟失。但AI只需要在傳輸過程中,保證數據的統計特性即可,傳輸100份數據與傳輸90份數據的統計結果差異微乎其微。

第四範式從去年開始研究開發新的硬件體系SageOne,我們不是爲了去生產硬件,而是爲了設計軟硬一體的方案,產出更適合人工智能專用算法的算力架構。目前第四範式設計的軟硬一體優化的服務器能夠做到TCO(總擁有成本)比傳統服務器降低一倍,到年底的時候希望有數量級的提升,會大幅降低企業“1+N”AI落地門檻及總擁有成本。