大模型重塑金融業態報告④丨金融大模型重塑技術能力
摘要:“大模型”無疑是2023年最熱的關鍵詞之一,隨着大模型概念的崛起和廣泛傳播,金融行業因被視作最優落地場景也同步掀起了一輪熱潮。大模型究竟會給金融行業帶來什麼?它會在何種程度上重塑技術和業務,會衍生出怎樣的商業價值?21世紀資管研究院調研了三十多家金融機構和科技公司相關負責人,形成了這份《大模型重塑金融業態報告》,通過梳理機構佈局情況以及這些領軍者們的觀點,描繪行業發展趨勢。
21世紀資管研究院研究員李覽青、楊夢雪
在金融機構基礎設施升級後,當金融機構決定嘗試大模型的落地應用,擺在其面前的首要問題是,如何部署大模型從而享受其帶來的涌現能力與服務能力?
據21世紀資管研究院調研,大模型落地實現AI應用的路徑有三個方向,一是基於現有開源大模型、基礎大模型進行微調落地,二是與廠商聯合創新自研大模型,三是通過API接口接入商用大模型或通過外掛知識庫實現部分功能的使用。
但在企業AI應用的架構中,僅有大模型顯然是不夠的,大模型中間件、向量數據庫等基礎設施軟件迎來新風口,而RPA技術也在與AI Agent(人工智能體)融合後實現了新飛躍。
連接器:中間件
一直以來,金融機構不同系統間的互聯互通與數據交換,都離不開中間件。如果說大模型是AI決策的“大腦”,那麼中間件就是鏈接大腦與應用場景之間的“四肢”。
作爲位於AI應用與大模型之間的中間層基礎軟件,這些組件在輸入輸出、數據轉換、模型部署時發揮重要作用,解決了大模型落地過程中資源調度、數據集成、模型訓練、應用集成、知識庫與大模型融合等問題。在解決大模型商用化問題方面,中間件行業再次受到市場關注。
一方面,在計算機“分層”架構的基礎上,引入中間層,可以實現不同業務中技術共性與服務共性的凝練,從而簡化開發流程。雖然業務應用系統開發的邏輯有差異,但基礎功能與系統服務是存在相似性的,基於這些相似性,可以儘可能凝練共性並複用,特別是在工程開發中基礎、底層、公用的服務邏輯,通過中間件包裝成簡單、一致、集成的開發環境,從而實現程序設計、功能與服務編排的簡化。大模型中間件的應用,可以幫助企業迅速構建出基於大模型的AI應用。
另一方面,AI應用的集成也需要中間件的參與。特別是金融機構的智能化應用集中於智能化交互、智能投研等領域,其服務的用戶可能不僅是內部用戶,還可能存在於微信、QQ、企業微信、飛書等等其他外部系統中。中間件可以支持多種不同軟硬件環境,來滿足不同場景下的集成需求。
可以說,大模型中間件解決了大模型落地的“最後一公里”,既爲上層應用訪問大模型與知識庫提供入口,也爲大模型的應用部署提供橋樑。
21世紀資管研究院在調研中瞭解到,目前大模型中間件的生態在底層的動態資源調度之外,還有以AI Ops(自動化運維)爲代表提供一整套工具,幫助機構解決私有環境中大模型訓練的工程問題,通過提供全自動化訓練環境配置與構建,以低代碼一站式完成數據接入、標註、監督微調、反饋強化學習和模型發佈全流程,同時,可以支持數據迴流及模型的持續迭代。
記憶體:向量數據庫
在大模型“四肢”中間件之外,向量數據庫作爲大模型的“記憶體”成爲大模型時代的必備基礎設施工具之一。
向量數據庫是專門用於存儲和查詢向量的數據庫。在數學定義中,向量是有大小和方向的量,可以用帶箭頭的線段表示,箭頭指向代表向量的方向,線段的長度代表向量的大小,兩個向量之間的距離或相似性可以通過公式求得。到計算機領域,文本、圖像、語音、視頻等非結構化數據的向量化,可以存儲到向量數據庫中,從而實現對非結構化數據的相似性檢索與搜索。
無論是通用大模型還是金融行業經過微調部署落地的垂直行業模型,都會出現信息時效性受限、大模型輸入token受限、算力不足以及胡言亂語的“幻覺”等問題。
在信息時效性方面,由於機器學習訓練需要一段時間,在這段時間內實時發生的資訊、新聞、市場行情等等快速變化,這些實時數據難以內置到模型中,需要一個外部的工具來存儲這些實時信息,實現及時調用。
大模型的token限制是指,在大模型訓練或推理時需要消耗大量計算資源,而這些資源是有限的,因此大模型輸入的token是有限的,一旦突破這個設置,模型就會忘記上下文。根據每個大模型算力能力與工程化難度的不同,其token輸入上限也有差異,如GPT-3限制2018個token、1024個漢字,GPT-4限制32000個token、16000個漢字。在輸入限制下,需要一個外掛工具來存放諸多歷史信息,爲大模型提供長期記憶,避免上下文信息丟失等問題。
同時,向量數據庫對於大模型專用顯卡沒有強依賴性,通過優化存儲與索引方式,就可以在普通的硬件上實現高效向量處理,在金融機構算力有限的情況下,可以有效節約算力成本。
最後是大模型的“幻覺”問題。通用大模型出現“一本正經的胡說八道”的情況,在要求絕對準確的金融領域是不被允許的,在大模型精確度尚未達標的情況下,需要外掛知識庫來補充大模型存在的知識缺陷,來使其可以給出準確的答案與更實時化的信息。
此外,對合規要求最嚴格的金融行業而言,出於對用戶隱私數據與個人金融數據保護要求,向量數據庫的訪問權限設置也可以AI大模型將這些數據作爲訓練語料。
向量數據庫具備低延遲查詢、高可用、高性能、高擴展性等特性,成爲金融機構部署大模型探索中的主流工具。特別是在圖像搜索、問答交互、文本分類、智能推薦、語義分析、模糊數據匹配等場景下,應用前景廣泛。
未來人工智能新形態:AI Agent
基於人工智能的RPA解決方案並不新鮮,金融機構通過RPA(機器人流程自動化)技術,讓軟件機器人代替業務人員完成各類軟件系統操作與業務處理,實現業務流程鏈接與自動化處理,從而讓人工專注於更有價值的工作任務。RPA的應用提高了員工的工作效率,減少了因人工疏漏導致的流程錯誤,也滿足了跨系統流程連接與數據集成的需求。
但在金融機構的實踐過程中,RPA的落地應用也存在挑戰,其中最核心的問題是,業務流程並不是按預期一樣一成不變的,面對動態業務環境,特別是對於不熟悉的場景,RPA可能出現崩潰,無法實現自適應變化,使得業務流程的穩定性難以保障。
AI Agent(人工智能體)爲RPA的進一步智能化提供了新的解決方案。AI Agent是一種能夠感知環境、進行決策、執行動作的智能實體,相比傳統的AI,AI Agent可以通過獨立思考、調用工具來逐步完成給定目標。這與原本大語言模型的學習能力一脈相承,基於GPT-4等大語言模型規劃與用戶設定的目標,AI Agent可以在完成並添加新任務後,根據此前任務的結果爲自己的工作流設置優先級,同時調用“記憶”,基於歷史記錄存儲過去結果,在錯誤中學習更新知識,並自主調整任務。
這切中了傳統RPA機器人工作中的業務痛點。當AI Agent+RPA,AI智能體獲得了不斷適應變化環境的能力,同時可以學習並實時洞察業務流程,根據用戶需求自主完成工作流構建,將動態決策自動編排進入工作流程中,並主動執行處理完成相應的複雜決策。
未來,基於大模型驅動的AI Agent,被普遍認爲是人工智能應用的新形態,相比於過去人工智能技術的相關應用,AI Agent表現出驚人的自主性與智能性,數據顯示過去兩年間針對AI Agent的研究投入增幅達到300%。
21世紀資管研究院梳理各大銀行科技投入與科技人員數量發現,近兩年來銀行科技投入已開始出現下滑態勢,科技人員新增數量也逐步減少。在雲平臺等基礎設施建設已初步完成後,下一步是釋放科技人員生產力。
AI Agent與RPA等傳統技術結合,應用於金融服務的各類場景,以自主學習的能力可以及時解決非給定流程中的其他問題,在金融數據合規與隱私安全保護合規的情況下,有望成爲金融從業人員與客戶未來的AI助手。