2022年1月21日,銀保監會(huì)發(fā)布《關于銀行業保險業數字化轉型的指導意見》(以下簡稱《意見》),明确指出“建立企業級的風險管理平台,實現規則策略、模型算法的集中統一管理”。在與業界多家金融機構風險負責人交流的過(guò)程中,筆者發(fā)現大家對(duì)于規則、策略、模型和算法的理解都(dōu)不盡相同,并且還(hái)存在諸多的模糊地帶,因此結合自身多年從事(shì)模型風險管理的經(jīng)驗,談談對(duì)于這(zhè)些概念的理解,希望能(néng)夠抛磚引玉,和各位同僚一起(qǐ)更好(hǎo)地理解監管的意圖和要求。提到模型的定義,我們不得不重溫一下模型風險管理界紅寶書,美聯儲與貨币監理署在2011年共同發(fā)布的Supervisory Letter 11-7 (以下簡稱“SR 11-7”),其中對(duì)于模型給出了較爲準确的定義,即“模型是應用統計、經(jīng)濟、金融或數學(xué)理論、技術和假設將(jiāng)輸入數據處理爲定量估計的量化方法、系統或途徑”,并且進(jìn)一步指出,“模型有三個組成(chéng)部分,即信息輸入部分,包含輸入數據和假設;信息處理部分,將(jiāng)輸入轉化成(chéng)估計輸入;輸出報告部分,將(jiāng)輸出估計轉化成(chéng)有用的業務信息”。我們可以簡單地理解爲模型是由輸入數據和假設、算子構建與确認、輸出數據三部分構成(chéng)。這(zhè)裡(lǐ)我們認爲,每個模型最後(hòu)的表達形式都(dōu)是一個算子,可以從确定的輸入數據得到唯一的模型輸出,包括評分卡模型的各入模特征的分箱與分值、金融交易産品的DCF估值(Black-Scholes、BSM等)、甚至于更複雜的IFRS9模型的ECL測算等。當然,上述的模型我們可以理解爲狹義模型,其定義域還(hái)是比較狹窄的,需要同時滿足“量化”與“估計”這(zhè)兩(liǎng)個條件。與之相對(duì)應的廣義模型,除了《意見》裡(lǐ)提到的規則、策略、算法,還(hái)包括計算工具、專家判斷、管理層疊加等,這(zhè)裡(lǐ)我們來一一梳理一下它們與狹義模型的異同。規則屬于一種(zhǒng)推理方式,是指專家系統或決策支持系統推理獲得的知識基于或依賴已存在的知識經(jīng)驗形成(chéng)的推理機制。規則的具體表現形式一般是數據字段、值(包括數值,字符串值等)以及各種(zhǒng)運算關系(包括基本運算和邏輯運算等)的組合,例如 A>600, B=‘M’AND C>6。其中A>600可以稱爲單條規則,A>600 AND C>6則可以稱爲規則集。可以看出,規則與模型本身并不互斥,像評分卡模型的表現形式— 基于最終入模特征的分箱與評分,本身也就是個規則集。但是,規則肯定不等于模型,或者說不等于狹義模型。以評分卡模型爲例,盡管其表現形式是規則集,然而,其前端有曆史數據的積澱、邏輯回歸算法的假設,後(hòu)端有特定的應用客群,這(zhè)整套才構成(chéng)一個完整的評分卡模型。當然,我們對(duì)于模型的理解也應該是動态的,與時俱進(jìn)的。以适應合規要求的反洗錢模型爲例,在國(guó)内此類模型很多時候并不涉及到有統計理念的評分[1],而隻是基于業務經(jīng)驗和數據分析的規則的組合,根據早期美聯儲SR 11-7的定義,這(zhè)類應該不能(néng)嚴格劃入模型的範疇。然而,我們可以看到,在2020年銀保監會(huì)發(fā)布的《商業銀行互聯網貸款管理暫行辦法》中,反洗錢模型已經(jīng)被(bèi)明确列爲九大類風險模型之一,同樣(yàng)屬于此類的還(hái)有另一大類合規模型,包括資金流向(xiàng)模型、資金回流模型等,盡管主要是以規則的形式呈現,但既然監管部門已經(jīng)明文通示,現在也都(dōu)應該劃入模型的範疇。SR 11-7裡(lǐ)對(duì)于模型的定義是一個“量化估計”,一般來說,估計本身是不作用于銀行業務的,需要通過(guò)一個執行的動作來實現對(duì)具體業務的推動,這(zhè)個動作就是策略。例如,信用卡業務裡(lǐ)的行爲評分卡B卡評分,本身是不産生實際的業務效果的,行方會(huì)圍繞著(zhe)這(zhè)個評分去制定相應的提額策略、營銷策略、預警策略等,最終實現對(duì)銀行業務的提升。另外,策略這(zhè)個詞Strategy,在決策科學(xué)(Decision Science)裡(lǐ)是需要有一個行動空間(Action Space)的,也就是說,策略的重點是在于有一個具體的動作,像上面(miàn)提到的提額、營銷、預警等,這(zhè)也是策略和一般模型的主要區别。再以市場風險場景爲例,金融交易産品的估值模型(Black-Scholes、BSM、Hull-White等)輸出的是産品的估值,交易員需要在此估值的基礎上,結合市場數據和信息,制定相應的交易策略或者對(duì)沖策略,這(zhè)才對(duì)最後(hòu)的交易業務産生實際影響。當然,随著(zhe)模型應用的愈發(fā)廣泛,有些時候策略與模型的界線也會(huì)比較模糊,例如,信用卡産品的最優化定價模型,最後(hòu)産出的是一個具體的定價,這(zhè)個定價可以直接應用到銀行業務裡(lǐ),此時,這(zhè)既是一個最優化定價模型,也是一個最優化定價策略;也有時候銀行的業務人員會(huì)對(duì)最優化定價模型的結果進(jìn)一步分析,再結合業務與專家經(jīng)驗,制定最後(hòu)的定價策略,這(zhè)時模型和策略就有比較明顯的區别了。一般來說,策略的表現形式多爲規則(集),反映的是基于業務經(jīng)驗與數據分析所做出的對(duì)銀行業務産生具體影響的動作。策略可以基于模型,也可以不基于模型—據筆者了解,國(guó)内某些中小行本身模型的數量非常小,但是策略還(hái)是廣泛存在的。一句話總結,模型的輸出結果通常會(huì)是量化估計,需要通過(guò)策略的應用和推動對(duì)銀行業務産生實際影響。算法(Algorithm)是一系列解決問題的清晰指令,代表著(zhe)用系統的方法描述解決問題的機制。算法中的指令描述的是一個計算,當其運行時能(néng)從一個初始狀态和(可能(néng)爲空的)初始輸入開(kāi)始,經(jīng)過(guò)一系列有限而清晰定義的狀态,最終産生輸出并停止于一個終态。算法是在數據上運行的過(guò)程,能(néng)夠對(duì)一定規範的輸入,在有限時間内獲得所要求的輸出,并且具備以下五個特征:(1)有窮性 (Finiteness):算法必須能(néng)在執行有限個步驟之後(hòu)終止;(2)确切性 (Definiteness):算法的每一步驟必須有确切的定義;(3)輸入項 (Input):一個算法有0個或多個輸入,以刻畫運算對(duì)象的初始情況,所謂0個輸入是指算法本身定出了初始條件;(4)輸出項( Output):一個算法有一個或多個輸出,以反映對(duì)輸入數據加工後(hòu)的結果,沒(méi)有輸出的算法是毫無意義的;(5)有效性( Effectiveness):算法中執行的任何計算步驟都(dōu)是可以被(bèi)分解爲基本的可執行的操作步驟,即每個計算步驟都(dōu)可以在有限時間内完成(chéng)。由此不難看出,算法和模型的區别還(hái)是比較明顯的,可以認爲算法本身就是一個算子,而模型則是由輸入數據和假設通過(guò)尋找合适的算子來輸出結果的整個過(guò)程。世界上的知名算法,例如貪心算法、快速排序算法等,本身都(dōu)不能(néng)稱之爲模型。回顧一下評分卡建模,我們通過(guò)長(cháng)清單、短清單、業務解釋性、特征相關性等步驟,在融入業務經(jīng)驗的基礎上,半自動地來獲取最後(hòu)的模型算子。不得不承認,随著(zhe)人工智能(néng)的發(fā)展與廣泛應用,算法與模型之間的差距的确是拉近了,像目前業界比較常用的XGBoost、LightGBM等機器學(xué)習集成(chéng)樹算法,基本可以實現無人工幹預的通過(guò)輸入數據和參數(超參數)配置來直接獲得輸出結果,因而基于這(zhè)些算法也可以直接構建相應的XGBoost模型、LightGBM模型等。這(zhè)裡(lǐ)我們也再聚焦一下《意見》裡(lǐ)第二十六條所提到的算法風險,在業界也引起(qǐ)比較多的讨論。筆者認爲,目前比較可見的算法風險有以下幾個層次:近年來,國(guó)内多家銀行都(dōu)在逐步去SAS化,更多地投入到開(kāi)源Python的懷抱。不得不說,Python具有非常強大的數據處理與建模能(néng)力,其各類擴展包也是應有盡有、層出不窮。然而,開(kāi)源本身所攜帶的風險也是明确存在的,例如在程序版本升級後(hòu)使用相同代碼在同樣(yàng)數據集上得到不同輸出(不管差别有多小)的事(shì)例也是常有發(fā)生。某國(guó)有大行的風險負責人曾與筆者探讨對(duì)當前應用比較廣泛的XGBoost等機器學(xué)習算法包進(jìn)行拆箱和破解的可能(néng)性,然而,我們知道(dào),在當前Python的這(zhè)些擴展包裡(lǐ),代碼動辄萬行起(qǐ),并且隻有一小部分是用來承載算法本身的,還(hái)有很多代碼則是用來優化調配系統運行資源,因此,真正完全破解算法黑盒對(duì)于模型專業的驗證人員來說,在資質能(néng)力和時間資源上都(dōu)是難以承擔的。在算法自身風險的防控上,筆者也并沒(méi)有特别好(hǎo)的建議,隻能(néng)推薦各位算法使用者小心監控每次的運行結果,争取在結果層面(miàn)可以發(fā)現算法表現的一些異常。這(zhè)幾年,伴随著(zhe)機器學(xué)習模型的廣泛應用,建模也慢慢形成(chéng)了一種(zhǒng)速食文化,傻瓜式建模、一鍵建模等噱頭層出不窮。在一些非專業人眼中,建模俨然變成(chéng)了調Python包,甚至于點擊建模按鈕。對(duì)于某些使用機器學(xué)習集成(chéng)樹算法建模的人員,該種(zhǒng)樹算法的目标函數是什麼(me),優化方式是什麼(me),使用的是Bagging還(hái)是Boosting,都(dōu)有可能(néng)一無所知,這(zhè)也正是建模人員不懂算法、不懂模型的巨大風險。相應的,《意見》二十六條裡(lǐ)提到的“審慎設置客戶篩選和風險評估等模型的參數”,也是要求機器學(xué)習建模人員對(duì)于模型的重要參數(如樹的深度、學(xué)習率、最小葉子尺寸等)都(dōu)要進(jìn)行充足的研究和論證,而不隻是簡單地使用系統默認參數。這(zhè)主要是針對(duì)于新興的機器學(xué)習和人工智能(néng)算法。衆所周知,這(zhè)些新興算法在訓練集上的拟合能(néng)力是非常驚人的,如果對(duì)決策樹深度和最小葉子尺寸不做限制的話,很容易在訓練集上實現接近完美的拟合度。然而,大家往往會(huì)發(fā)現,越是在訓練集上性能(néng)完美,越可能(néng)在測試集上表現得不如人意,這(zhè)也是此類模型在泛化能(néng)力上的局限性。傳統的回歸模型,捕捉的更多是在核心特征層面(miàn)的共性和單調性,而這(zhè)樣(yàng)的特質在新型模型則難以體現。另外,回歸模型使用的是BLUE(Best Linear Unbiased Estimator),可以做到估計是無偏的,即模型的輸出均值等于樣(yàng)本均值,這(zhè)一點也是樹模型無法保證的。從目前的業界來看,使用新興算法的多是預測類模型,因此算法的穩定性非常重要,需要相關的建模人員按照《意見》要求小心論證。另外,筆者認爲,《意見》裡(lǐ)另外提到的算法的透明性風險和可解釋性風險,都(dōu)可以包含在穩定性風險裡(lǐ),即算法的穩定性是最終目的,而算法的透明性和可解釋性都(dōu)是爲穩定性服務的。這(zhè)裡(lǐ)主要指的是在人工智能(néng)自動化決策中,由數據分析導緻的對(duì)特定群體的,系統的、可重複的、不公正對(duì)待,其突出表現有種(zhǒng)族歧視(例如更容易將(jiāng)某一特定種(zhǒng)族的客群劃入高風險群體)、性别歧視(例如更容易將(jiāng)某一性别的客群劃入高風險群體)、價格歧視(例如出于盈利的考慮故意給予較低風險的客戶更高的風險定價)等。《意見》二十六條裡(lǐ)也明确提到了“防止算法歧視”。計算工具是基于特定的計算邏輯或者假設進(jìn)行相應計算的工具,比較常見的有分期貸款裡(lǐ)基于當前餘額、利息、期數等因素的攤銷計算,基于會(huì)計學(xué)準則進(jìn)行的收入報表、現金流表、資産負債表之間的款項計算等。計算工具與模型最大的區别在于計算工具所承受的假設一般也并非數學(xué)或者統計上的假設,因此其計算的結果具備确定性,而模型的輸出結果往往都(dōu)是不确定的,會(huì)由模型假設、模型設計、建模方式等多個因素的影響。不過(guò),随著(zhe)現在計算工具的豐富,我們也看到一些功能(néng)更強大的計算工具,例如某國(guó)有大行的某中心廣泛使用同一個計算評分卡建模中WOE、IV包括分箱的工具,也包括底層的分箱邏輯,并且後(hòu)續的計算結果會(huì)被(bèi)應用到多張評分卡建模過(guò)程中。遇到這(zhè)種(zhǒng)情況我們就需要具體問題具體對(duì)待了,像這(zhè)個例子裡(lǐ)的分箱工具,由于包含内嵌的分箱邏輯,其分箱結果本身也具備不确定性,并且下遊對(duì)接多個模型,具有較高的模型依賴度,我們甚至會(huì)推薦把它當成(chéng)模型來進(jìn)行管理。專家判斷指的是一種(zhǒng)推斷方式,即依靠專家的業務經(jīng)驗來進(jìn)行評判,但是具體來說評判的範圍會(huì)比較廣,例如對(duì)客群的劃分,對(duì)未來資産餘額的預測,對(duì)客戶風險的評估等。專家判斷和模型在定義上并不在一個維度,但是會(huì)有交叉,例如基于專家經(jīng)驗對(duì)反洗錢過(guò)程中客戶風險評分的判定,包括國(guó)别/地區/行業/資産規模等因素的具體打分,可以構成(chéng)一個專家判斷模型。簡言之,專家判斷未必是模型,但當專家判斷足夠量化的時候,是可能(néng)夠得上模型定義的。對(duì)于專家判斷模型的管理,也是很多銀行在日後(hòu)的模型管理工作中不可避免的功課。管理層疊加指的是在模型之外作出的一系列調整。主要包括:(1)彌補已知的模型缺陷,包括模型假設的局限性以及其它未在模型中考慮到的現實因素;(2)運用管理層經(jīng)驗,對(duì)模型結果做出更加符合未來市場變化的前瞻性調整。管理層疊加一般與模型是串行的,并且是作用在模型結果之上的。近年來,國(guó)内各行對(duì)于管理層疊加也愈發(fā)重視,特别是今年5月《商業銀行預期信用損失法實施管理辦法》第二十六條裡(lǐ)指出,“商業銀行應審慎運用管理層疊加,對(duì)某一風險因素運用管理層疊加應有規範的審批流程”,也因此有很多客戶在詢問比較好(hǎo)的管理層疊加實踐方法。值得一提的是,美國(guó)貨币監理署給出了一套基于9個定性因素的9Q Factor Framework,在美國(guó)銀行界已經(jīng)廣爲應用在撥備計提上,在此由于篇幅限制就不具體展開(kāi)介紹了。根據筆者多年從事(shì)模型風險管理工作的經(jīng)驗,模型的判定不是一件簡單的事(shì),并非一兩(liǎng)句話就可以說清楚。有些銀行客戶希望能(néng)夠在《模型管理辦法》裡(lǐ)用有限的一句或者幾句話就能(néng)將(jiāng)模型的判定完全闡釋明白,是不太可能(néng)實現的。事(shì)實上,每家金融機構自身發(fā)展階段不同,模型工作團隊的大小不同,對(duì)于模型的理解和管理能(néng)力亦有差别,最後(hòu)确定的模型範疇和管理範圍也必然會(huì)因行而異,例如,某家大行選擇將(jiāng)規則納入模型的管理範圍,而某家股份制行決定現階段暫時不納入。另外,無論《模型管理辦法》裡(lǐ)對(duì)模型的定義有多清晰,實際上都(dōu)需要一些具體案例分析的加持來明确最後(hòu)的模型判定和範疇,這(zhè)也是我們在國(guó)内外多家從事(shì)模型風險管理實操的心得。
盡管如此,筆者還(hái)是根據多年服務國(guó)内外先進(jìn)大行的經(jīng)驗,總結了以下的模型判定的涵蓋标準和排除标準,供各位業界同僚參考。這(zhè)裡(lǐ)的标準裡(lǐ)除了針對(duì)上面(miàn)提到的各類廣義模型,還(hái)特别考慮了一些純IT層面(miàn)的程序和系統,以及未實際投産的一次性分析等,對(duì)于實際模型判定的有效性應該能(néng)達到80%左右,希望能(néng)給到大家一些借鑒。這(zhè)裡(lǐ)比較重要的一點,是希望各位不要過(guò)分拘泥于模型判定這(zhè)件事(shì)本身——如果是模型,自然是要納入模型範疇進(jìn)行管理的;如果不是模型,也要充分考慮其是否對(duì)銀行業務可能(néng)産生的風險和影響,如果有的話,即便不用納入模型風險進(jìn)行管理,也需要納入全面(miàn)風險管理的相應分支裡(lǐ)去,并且明确其責任人,做到風險管控無遺漏。
最後(hòu),筆者想強調,模型識别和判定作爲模型管理的第一步,在實操中非常重要。這(zhè)一步走對(duì)了,後(hòu)面(miàn)的模型管理工作就會(huì)事(shì)半功倍,否則就有可能(néng)事(shì)倍功半。我們希望所有金融機構都(dōu)能(néng)建立起(qǐ)各自機構内對(duì)于模型的統一理解,爲《意見》裡(lǐ)提出的企業級模型風險管理工作奠定良好(hǎo)的基礎。睿智科技坐擁國(guó)内最好(hǎo)的模型管理咨詢團隊,願以我們世界級先進(jìn)實踐和經(jīng)驗,助力各位業界同僚的模型管理體系建設!
[1]在國(guó)外,反洗錢模型中的交易監控中的評分包括行爲變化評分(Change In Behavior, or CIB Score)、資金快速流動評分(Rapid Movement of Funds, or RMF Score)等。