文:朱英子
來源:21世紀經(jīng)濟報道(dào)
随著(zhe)國(guó)家對(duì)數據的開(kāi)發(fā)利用監管趨嚴,如何在不洩露隐私的情況下實現多方數據融合以支撐業務更好(hǎo)地進(jìn)行,成(chéng)了金融行業必須面(miàn)臨的課題。其中,隐私計算中的多方安全計算(MPC)是近年來最常被(bèi)提及的技術實現路徑,随之而來的技術标準和應用規範的建立成(chéng)了重要一環。
7月6日,中國(guó)支付清算協會(huì)起(qǐ)草并在官網發(fā)布《多方安全計算金融應用評估規範》(下稱“規範”),該規範适用于多方安全計算的金融應用機構、技術服務和解決方案提供商,自發(fā)布之日起(qǐ)實施。
協會(huì)稱,此舉是爲落實央行和國(guó)家認監委關于加強金融科技産品認證工作的相關要求,加強金融科技産品認證工作的自律管理。
規範主要起(qǐ)草單位除清算協會(huì)、銀行、BATJ系外,還(hái)包含多家隐私計算行業的頭部科技公司,如華控清交、富數科技、數牍科技等等。
據悉,2020年11月,央行發(fā)布過(guò)《多方安全計算金融應用技術規範》,此次協會(huì)發(fā)布的規範亦是對(duì)此的進(jìn)一步落實與公開(kāi)。
兩(liǎng)大應用場景
21世紀經(jīng)濟報道(dào)記者拿到的《多方安全計算金融應用技術規範》顯示,多方安全計算在金融應用中,最常見的有兩(liǎng)大場景:基于MPC的生物特征識别和聯合風控。
第一大場景中,基于MPC的生物特征識别可實現生物特征信息的安全共享,降低生物特征信息洩露造成(chéng)的個人信息和财産信息的風險。
以刷臉付爲例,金融機構將(jiāng)注冊的人臉特征信息通過(guò)MPC數據輸入處理後(hòu)形成(chéng)計算因子,并將(jiāng)計算因子提交給相關業務處理系統保存爲人臉底庫。
個人在終端設備支付時,終端設備將(jiāng)目标人臉特征信息也通過(guò)MPC數據輸入處理後(hòu)形成(chéng)計算因子,并將(jiāng)計算因子上傳至計算節點(MPC計算節點分域管理,其中的部分計算節點也可以由銀行管轄)。各計算節點基于計算因子進(jìn)行目标匹配和識别,最後(hòu)將(jiāng)人臉識别結果返回并繼續後(hòu)續支付處理環節。
在該應用中,MPC調度方的功能(néng)嵌入到業務處理系統中,并最終獲得MPC計算節點的人臉識别結果。算法邏輯即人臉識别算法已經(jīng)提前預置在計算節點内。
注冊環節獲得的是以計算因子形式保存的人臉信息,而非原始圖像,避免人臉原始圖像信息共享。
識别環節自終端傳輸至人臉識别系統的人臉信息也是以計算因子形式呈現,避免人臉原始圖像信息被(bèi)獲取。
第二大場景中,基于MPC的聯合風控是多個金融機構之間通過(guò)MPC協議來交換風控數據,共同完成(chéng)風控數據分析、風控模型訓練和風險決策的任務,實現風控模型的精細化和個性化部署,保護風控數據的安全性,降低因金融機構間安全信息不相通、風控能(néng)力參差不齊等造成(chéng)的欺詐風險。
具體流程爲:任務發(fā)起(qǐ)方向(xiàng)調度方發(fā)起(qǐ)聯合風控建模和決策的任務;調度方對(duì)聯合風控任務進(jìn)行觸發(fā)和協調,并將(jiāng)調度任務發(fā)送至不同的金融機構;金融機構讀取本地的風控數據和風控模型,作爲MPC輸入因子;金融機構的MPC計算節點之間,基于MPC協議進(jìn)行多次的随機數或加密參數交換,完成(chéng)聯合風控的建模和決策;金融機構各自得到聯合風控的決策結果。
何爲多方安全計算?
官方定義稱,多方安全計算是基于多方數據協同完成(chéng)計算目标的密碼技術,實現除計算結果及其可推導出的信息之外不洩漏各方隐私數據。多方安全計算常采用的技術有混淆電路、不經(jīng)意傳輸、 秘密分享、同态加密等。
《多方安全計算金融應用技術規範》提到,在金融業中,該技術主要應用于三大類,聯合查詢、聯合建模、聯合預測。
在聯合查詢應用中,查詢方作爲任務發(fā)起(qǐ)方,通過(guò)調度方提交查詢計算任務請求;查詢方作爲數據提供方將(jiāng)其查詢條件轉化爲輸入因子,其他數據提供方將(jiāng)數據庫待查詢數據轉化爲輸入因子,并將(jiāng)輸入因子上傳至事(shì)先約定的計算節點;計算方收到調度方分配的查詢任務請求,根據獲得的輸入因子進(jìn)行計算得到查詢結果對(duì)應的輸出因子,并把輸出因子發(fā)送給結果使用方進(jìn)行數據解析;結果使用方通過(guò)數據解析獲得查詢結果的明文。
最後(hòu),查詢方得到查詢結果,但不暴露其查詢輸入(例如查詢條件、數據樣(yàng)本)和查詢結果;數據提供方不暴露其數據庫存儲的明文數據;查詢結果與在明文數據庫上的查詢的結果一緻。
在聯合建模應用中,任務發(fā)起(qǐ)方向(xiàng)調度方提交模型訓練任務;算法提供方上傳或指定模型訓練所使用的算法邏輯,其算法參數或模型參數有保密需求的,可作爲數據提供方之一以計算因子的方式提供;計算方收到調度方分配的建模任務請求,從各數據提供方獲得數據集的計算因子,并利用訓練算法在數據集上進(jìn)行模型訓練,將(jiāng)得到的輸出因子發(fā)送至結果使用方進(jìn)行解析;結果使用方通過(guò)解析獲得訓練所得的模型明文。
該應用目标爲,各數據提供方不暴露其數據集的明文;能(néng)保護模型參數在訓練過(guò)程中的隐私安全,隻有結果使用方才能(néng)得到訓練後(hòu)的模型明文;訓練得到的模型與在明文數據集上訓練得到的模型在新數據上具備預測結果的一緻性。
在聯合預測應用中,任務發(fā)起(qǐ)方向(xiàng)調度方提交計算任務,指定聯合預測所使用的算法;提供樣(yàng)本數據的數據提供方將(jiāng)樣(yàng)本數據轉化爲輸入因子,并提交給指定的計算方;提供模型的數據提供方將(jiāng)模型參數轉化爲輸入因子并提交給指定的計算方,當模型參數不宜對(duì)外提供時,該數據提供方應作爲計算方,避免提交模型參數;計算方接收調度方分配的預測任務請求,根據預測算法對(duì)樣(yàng)本數據的輸入因子進(jìn)行計算,將(jiāng)計算得到的預測結果的輸入因子發(fā)送給結果使用方進(jìn)行數據解析;結果使用方有通過(guò)解析輸出因子獲得預測結果明文。
最後(hòu),數據提供方不暴露其樣(yàng)本數據明文;模型提供方不暴露其預測模型的參數;隻有結果使用方才可以獲得預測結果明文;預測結果與采用明文預測模型對(duì)明文樣(yàng)本數據的預測結果一緻。
聯合預測通常和聯合建模複合應用,此情況下應將(jiāng)複合任務分解爲兩(liǎng)個MPC計算任務,一個任務的輸出可作爲另一個任務的輸入,不必進(jìn)行數據(如模型參數)輸出後(hòu)再重新輸入的處理。