金融大模型應用面臨三大挑戰,聯邦學習是否是破局關鍵?

近年來,以大模型爲代表的AI技術進入發展快車道,成爲當下最受大衆矚目的熱點話題。

伴隨大模型技術的飛速發展,全球人工智能技術發展和應用迭代速度都得到了極大提升,大模型技術也被認爲是通用人工智能技術的核心引擎。

工信部發布的數據顯示,截至2023年6月,我國人工智能核心產業規模已經達到5000億,人工智能企業數量超過4400家。

7月2日,在“大模型時代AI前沿與金融應用”爲主題的微衆媒體學院會議上,業內專家普遍認爲,以金融爲代表的大模型技術在發展應用中顯現三大挑戰:一是從算力角度,大模型的訓練過程中需要龐大的硬件算力資源支撐,大模型參數規模呈持續擴張趨勢,對算力提出了更高要求;二是從算法角度,大模型生成內容可能存在安全風險,同時廣泛存在隱形偏見的可能性;三從數據角度,近年來各項法律法規對私域數據的使用有“數據可用不可見”的要求,在醫療、金融等行業都存在海量自治的高質量數據,但受限於隱私無法共享利用。

事實上,在大模型的實踐應用中,金融行業由於具備數字化程度高、商業化應用場景潛在價值高等優勢,成爲了AI大模型落地應用的最佳場景之一。

微衆銀行首席人工智能官楊強指出,大模型的應用落地涉及數據管理、算法優化、系統設計和成本控制等多方面的綜合挑戰,需要持續的技術創新和策略調整,以推動AI技術更加成熟、高效地服務於社會各個領域。“AI Agent(人工智能業務助理)是大模型面向應用端發展的下一階段,其基於大模型的通用能力,並結合相關領域知識適應不同場景需求。”

此外,在楊強看來,隨着大模型的發展,如果面臨數據缺乏的問題,會衍生出一個概念即聯邦大模型。這個聯邦的概念實際上是一個分佈式概念。現在的大模型基本上都是一箇中心化訓練出來的結果,會利用大量算力、數據和電力來做訓練。

楊強認爲,當大模型的數據載量大到一定程度,社會就沒辦法承擔相關成本,最好是分解成一些分佈式的算力中心,這些小的算力中心可以用來訓練一個個小的大模型。“他們之間的連接幫助形成一個全局的大模型。這個全局大模型,第一個是具有分佈式的能力,第二個是可以在保護隱私的前提下,利用好每一個地點的數據。”楊強分析說。

楊強認爲,未來每一個人的手機都是一個算力中心。陌生人之間也可以合作,聯成一個網絡,共同訓練在某個領域的大模型。這些模型都是在本地訓練、本地使用,通過聯網的方式,這個分佈式網絡叫聯邦網絡,既能保護隱私,又能夠做到分佈式訓練。

楊強指出,通過縱向聯邦學習,可以幫助企業之間解決數據合作的問題,使用各自的特有數據,共同建立更加強大的模型。

“比方說一方是金融機構,另一方是非金融機構。非金融機構有豐富的數據,但由於企業用戶數據隱私安全的要求無法直接互通數據。這種情況下兩邊可以合作,形成一個全局模型,來幫助金融機構建立更好的風控模型或者營銷模型。”

楊強坦言,如何最好地保護隱私,如何能夠把算法效率給提升到最高,並且讓這個模型最準,這三個目標是互相牽制的。因此需要通過研究不同的聯邦學習範式來解決這三個目標的協調問題。

“聯邦學習就像是讓模型去作爲溝通的方式,而不是利用數據作爲溝通的方式,這樣原始數據可以不出本域也可以把模型給做出來。”楊強說。

微衆銀行人工智能首席科學家範力欣認爲,聯邦學習作爲一種先進的分佈式機器學習範式,允許參與方在不直接共享原始數據的情況下協作訓練模型,爲解決大模型應用落地的技術難題提供了創新路徑。

“聯邦大模型技術路線通過其獨特的設計,不僅解決了數據時效性、模型幻覺、專業知識融合及算力資源消耗等挑戰,而且在保護數據隱私和促進AI技術公平性方面邁出了重要一步,爲大模型在以金融爲代表的各領域的廣泛應用開闢了新的可能。”範力欣表示。