首頁
關于我們
業務介紹
合作案例
戰略合作夥伴
行業動态
加入我們
搜索
行業動态

大模型重塑金融業态報告——金融基礎設施再進(jìn)化

發(fā)布時間:2024-02-07

文:李覽青、楊夢雪 來源:21世紀經(jīng)濟報道(dào) 

從電子化到數字化再到智能(néng)化,金融機構的基礎設施更叠,是其轉型發(fā)展最重要的環節之一。

過(guò)去十年,金融基礎設施的改造集中于“上雲”,實現了傳統“煙囪式”系統架構的平台化,如今,大模型的到來也開(kāi)啓AI原生時代,對(duì)金融機構基礎設施進(jìn)化提出新要求。

“大模型的發(fā)展路徑與雲計算在諸多方面(miàn)表現出很大的相似性,AI基礎模型至少在語言領域已經(jīng)表現出很強的通用性,并且正在像雲計算那樣(yàng)成(chéng)長(cháng)爲新型基礎設施。”中國(guó)信通院雲計算與大數據研究所所長(cháng)何寶宏在《數字原生》一書中如是說。

大模型時代,數據、算力、算法共同構成(chéng)金融機構搭建大模型的“三駕馬車”。GPT-3的勝利,一度被(bèi)視作“暴力美學(xué)”的勝利,高達1750億的參數規模讓模型性能(néng)顯著提升,賦予其強大的智能(néng),這(zhè)就是大模型的能(néng)力“湧現”。

但是數據、算力的暴力堆疊,沒(méi)有與模型的精确畫上等号,往往越大的模型在知識量到達一定階段可能(néng)出現“幻覺”問題。因此,在資源有限的背景下,金融機構面(miàn)臨的問題是:如何提高算力的使用效率?如何挖掘可訓練的語料庫?

大模型時代,金融機構已開(kāi)始重塑基礎設施服務。

AI原生時代降臨

據21世紀資管研究院調研,從傳統IT的IOE架構到業務平移上雲,頭部金融機構的“上雲”進(jìn)程已初步完成(chéng)。特别是大型國(guó)有銀行與頭部股份制銀行,在完成(chéng)以虛拟化爲核心的雲平台1.0階段後(hòu),從2020年開(kāi)始發(fā)力分布式架構的雲平台建設,招商銀行平安銀行中信銀行等已基本完成(chéng)了傳統科技架構向(xiàng)雲架構的轉換。

2021、2022年是行業步入雲原生的2.0階段。雲原生源自于雲計算,其構建和部署都(dōu)基于雲平台,是一種(zhǒng)構建、運行應用程序的技術方法。傳統的雲計算服務包括基礎設施即服務(IaaS)、平台即服務(PaaS)、軟件即服務(SaaS)三大方面(miàn),在基礎設施、平台、軟件都(dōu)已實現上雲後(hòu),下一步通過(guò)統一标準在雲上構建應用,就是雲原生。雲原生應用從架構設計、開(kāi)發(fā)方式到部署維護,都(dōu)是在雲平台上進(jìn)行的。

相比傳統的硬件基礎設施,雲計算平台打通部門、層級、區域的限制,可以實現資源的高度複用、靈活調度和有效供給。而基于标準化的雲原生技術,進(jìn)一步降低了雲上應用開(kāi)發(fā)的難度,將(jiāng)産品不斷拆分成(chéng)爲“微服務”,使得開(kāi)發(fā)決策效率更爲敏捷。

從提升資源效應到業務敏捷化,如今随著(zhe)AIGC等技術融合,業務智能(néng)化發(fā)展對(duì)金融機構深度用雲提出更高的要求。在雲平台本身就具備的穩定可靠、彈性靈活、安全合規等特性之外,將(jiāng)AIGC引入研發(fā)設計、生産控制與運營維護等流程,可以實現業務智能(néng)化、決策智能(néng)化,降低數字化應用的門檻。

值得注意的是,目前金融機構探索大模型落地應用的場景依然是“怎樣(yàng)把已有的事(shì)情做得更好(hǎo)”,但在AI驅動下有望獲得新的應用創新。大語言模型與傳統的小模型不同,不僅可以在規則導向(xiàng)下獲得深度學(xué)習的能(néng)力,實現自主分析、自主決策,生成(chéng)式AI還(hái)可以在全業務領域實現多模态業務内容生成(chéng)、逆向(xiàng)工程、自然語言交互、自主任務分解等。

優化基礎設施突破算力瓶頸

然而,對(duì)于金融機構而言,算力資源是布局大模型的最大瓶頸。

有行業專家曾給21世紀資管研究院算過(guò)一筆賬,如果在金融垂直領域把所有公開(kāi)數據都(dōu)訓練完,一次達标的預訓練,以彭博旗下BloombergGPT的500億參數計算,需要花費200張以上的英偉達A100顯卡,僅一次訓練支出就在200萬以上,低于這(zhè)一體量的訓練可能(néng)效果會(huì)不及預期。

與以往的AI訓練模型方式不同,大模型的訓練任務是“多機多卡”式的,在分布式任務訓練下需要消耗大量的資源。微軟在2023年的财報中首次將(jiāng)GPU的可用性确定爲風險因素,微軟表示將(jiāng)繼續尋找和評估擴大數據中心位置和增加服務器容量的機會(huì),以滿足客戶不斷變化的需求,特别是考慮到對(duì)人工智能(néng)服務不斷增長(cháng)的需求。

對(duì)于金融機構而言,訓練自己的大模型路徑包括二次訓練精調與聯合共創兩(liǎng)種(zhǒng)方式。在二次訓練精調模式下,基于已有的預訓練模型,金融機構在整個神經(jīng)網絡的最後(hòu)一層進(jìn)行修改,其他參數不變,盡管所需的算力要求相較預訓練小很多,但一次訓練也依然需要數十張A100顯卡。而聯合共創模式下,則是將(jiāng)大模型的智能(néng)化能(néng)力内置應用于智能(néng)客服、智能(néng)投研等金融場景下,結合金融機構内部數據進(jìn)行訓練。

爲解決算力資源瓶頸,據21世紀資管研究院調研,金融機構選擇的路徑有:一是頭部金融機構基于囤積的GPU進(jìn)行探索,二是嘗試將(jiāng)少量訓練與精調挪到公有雲上,解決一部分算力問題,采用向(xiàng)量數據庫等外挂知識庫也是一大選擇。

不過(guò),金融機構的智能(néng)化創新變革,需要一個能(néng)夠承載數據量井噴、支持全息影像式客戶數據分析、能(néng)夠快速适配各類應用場景的平台,彈性、靈活、可擴展、韌性成(chéng)爲AI原生時代金融基礎設施的關鍵要素。

從爲金融機構提供相關基礎設施服務的頭部信創廠商的實踐來看,目前常見的AI應用基礎設施架構包括算力層、平台層、大模型層、應用層等四層架構。

在底層算力層面(miàn),混合多雲幫助機構實現靈活跨雲應用管理;多地多活的災備體系提高機房容災能(néng)力,加強了底層技術架構的穩定性與連續性;應用程序的容器化部署簡化了應用開(kāi)發(fā)、構建、部署、管理的流程,提高了業務資源的利用率;向(xiàng)量數據庫、數據湖、數據倉庫等技術則實現了數據資源的優化布局。

在平台層面(miàn),可以實現從數據預處理、模型訓練、模型部署的一站式訓練,通過(guò)業務共性的沉澱與提煉,大幅提升模型訓練效率。據21世紀資管研究院了解,由于大模型的分布式訓練任務,以“多機多卡”形式推進(jìn),更需要對(duì)算力資源進(jìn)行充分的感知與适配。用于大模型訓練的機群下的算力節點在同一時間分配了不同程度的運行任務,提升AI中台的感知能(néng)力以靈活選擇資源調度器更爲重要。

在大模型層面(miàn),金融機構可以根據不同細分場景業務需求,選擇通過(guò)API接口接入通用大模型,獲取一部分智能(néng)化能(néng)力,或通過(guò)微調訓練自己的垂直大模型,實現技術使用成(chéng)本的降低。



關鍵詞: