近年來,聯(lián)邦學(xué)習(xí)(Federated Learning)與安全多方計(jì)算、區(qū)塊鏈、可信執(zhí)行環(huán)境(TEE)成為隱私計(jì)算的技術(shù)路徑。
金融是聯(lián)邦學(xué)習(xí)主要探索應(yīng)用領(lǐng)域。聯(lián)邦學(xué)習(xí)提供金融風(fēng)控、金融營銷、評分卡等業(yè)務(wù)場景的多方數(shù)據(jù)源聯(lián)合建模服務(wù)。隨著行業(yè)應(yīng)用的深化,可用性、效率等多維度被納入整體技術(shù)框架,“可信聯(lián)邦學(xué)習(xí)”新范式應(yīng)運(yùn)而生。
“需要在‘安全與效率’權(quán)衡中推演出一個(gè)恒定定律。”微眾銀行首席人工智能官楊強(qiáng)在近日采訪中對記者表示,根據(jù)論文《聯(lián)邦學(xué)習(xí)中隱私與模型性能沒有免費(fèi)午餐定理》,通過隱私與模型性能的“No-free-lunch”安全-收益恒定定律,可實(shí)現(xiàn)可信聯(lián)邦學(xué)習(xí)中安全、效用、效率三者的協(xié)調(diào)。
楊強(qiáng)認(rèn)為,“法律法規(guī)與技術(shù)有機(jī)且無縫的結(jié)合”是未來金融行業(yè)需要注意的關(guān)鍵。此外,如何設(shè)計(jì)巧妙的算法,使聯(lián)邦學(xué)習(xí)能夠應(yīng)付可能的安全隱患是未來大規(guī)模運(yùn)用至金融場景的重要挑戰(zhàn)。
數(shù)據(jù)“安全-效用-效率”權(quán)衡間的保護(hù)機(jī)制
中國與美國正在引領(lǐng)全球聯(lián)邦學(xué)習(xí)發(fā)展。據(jù)統(tǒng)計(jì),在聯(lián)邦學(xué)習(xí)領(lǐng)域,全球高被引論文領(lǐng)先的機(jī)構(gòu)依次是谷歌、卡內(nèi)基·梅隆大學(xué)、北京郵電大學(xué)及微眾銀行。
聯(lián)邦學(xué)習(xí)是一種分布式機(jī)器學(xué)習(xí)技術(shù),以實(shí)現(xiàn)“數(shù)據(jù)可用不可見”、“數(shù)據(jù)不動模型動”的應(yīng)用新范式。
楊強(qiáng)表示,根據(jù)設(shè)定的四個(gè)維度(威脅的源頭、威脅性質(zhì)、隱私窺探的有意/無意及保護(hù)措施的嚴(yán)格程度),微眾銀行現(xiàn)正與各機(jī)構(gòu)合作,推動基于“No-free-lunch”定律的新標(biāo)準(zhǔn)建設(shè)。
作為一種新范式,“可信聯(lián)邦學(xué)習(xí)”增強(qiáng)了傳統(tǒng)的聯(lián)邦學(xué)習(xí),使得在保證原始數(shù)據(jù)的隱私安全和模型的可證安全外,還保證學(xué)習(xí)過程的高效率和模型的可用性,模型決策機(jī)制的可解釋性,模型的可溯源和審計(jì)監(jiān)管。
“需要設(shè)計(jì)一種保護(hù)機(jī)制,在‘安全與效率’權(quán)衡中推演出一個(gè)恒定定律!睏顝(qiáng)指出,根據(jù)《聯(lián)邦學(xué)習(xí)中隱私與模型性能沒有免費(fèi)午餐定理》,通過隱私與模型性能的“No-free-lunch”安全-收益恒定定律,可實(shí)現(xiàn)可信聯(lián)邦學(xué)習(xí)的安全、效用、效率三者的協(xié)調(diào),在保證數(shù)據(jù)隱私保護(hù)的同時(shí),也最大化模型效用和學(xué)習(xí)效率。
“在中小微企業(yè)信貸場景中,針對中小微企業(yè)信貸評審數(shù)據(jù)稀缺、不全面、歷史信息沉淀不足等問題。”楊強(qiáng)說,通過聯(lián)邦學(xué)習(xí)機(jī)制,可在確保數(shù)據(jù)提供方數(shù)據(jù)安全以及隱私保護(hù)的情況下,為銀行融匯企業(yè)經(jīng)營數(shù)據(jù)、稅務(wù)數(shù)據(jù)等多源信息,豐富建模特征體系,共同提升模型的有效性。
此外,通過將風(fēng)險(xiǎn)前置,從風(fēng)險(xiǎn)源頭切入,隱私計(jì)算還可幫助金融機(jī)構(gòu)過濾信貸黑名單客戶。
楊強(qiáng)表示,所有金融場景的應(yīng)用均有其共性(如風(fēng)控、銷售、服務(wù)),也有其特殊性(如偏重線上或線下,營銷還是反欺詐),對此,可以設(shè)計(jì)不同的聯(lián)邦學(xué)習(xí)引擎,最大化安全與效率的平衡。
巧妙打造“數(shù)據(jù)安全鎖”
央行《金融科技發(fā)展規(guī)劃(2022-2025年)》明確提出,加強(qiáng)金融科技倫理建設(shè),深化數(shù)字技術(shù)金融應(yīng)用,健全安全與效率并重的科技成果應(yīng)用體制機(jī)制。
《金融領(lǐng)域科技倫理指引》也要求,金融機(jī)構(gòu)充分獲取用戶授權(quán),以最小必要原則采集數(shù)據(jù),使用數(shù)據(jù)秉持“專事專用”原則,嚴(yán)格采取防護(hù)措施,依法合規(guī)共享數(shù)據(jù)。
楊強(qiáng)稱,越來越多的金融行業(yè)在邁向數(shù)字化與智能化,二者聯(lián)合起來可被稱為“數(shù)智化”。數(shù)智化的一個(gè)重要驅(qū)動因素為數(shù)據(jù)要素流通是,即數(shù)據(jù)由一個(gè)地點(diǎn)流至另一個(gè)地點(diǎn),這由此構(gòu)成了金融業(yè)另一個(gè)發(fā)展特征:數(shù)據(jù)的可交易化。
在“流動”中才能更好地發(fā)掘應(yīng)用數(shù)據(jù)的價(jià)值。楊強(qiáng)表示,在數(shù)據(jù)交易所內(nèi),所有數(shù)據(jù)均會被定價(jià),且受到知識產(chǎn)權(quán)等認(rèn)證。
“上述特點(diǎn)構(gòu)成了未來金融生態(tài)的重要特征。他強(qiáng)調(diào),通過提升數(shù)據(jù)的安全與可交易性,聯(lián)邦學(xué)習(xí)將持續(xù)對金融業(yè)態(tài)的發(fā)展發(fā)揮關(guān)鍵作用。
針對目前聯(lián)邦學(xué)習(xí)中同態(tài)加密、差分隱私等隱私保護(hù)方法可能帶來計(jì)算和通信開銷大、模型性能大幅下降的弊端,論文《FedCG: 聯(lián)邦條件對抗生成網(wǎng)絡(luò)》提出在橫向聯(lián)邦學(xué)習(xí)中將生成對抗網(wǎng)絡(luò)與分割學(xué)習(xí)相結(jié)合,有效保護(hù)了參與方的數(shù)據(jù)隱私,同時(shí)保障了各參與方模型性能的競爭力。該論文提出了名為FedIPR的首個(gè)聯(lián)邦學(xué)習(xí)模型版權(quán)驗(yàn)證框架。
“如何使技術(shù)與法律法規(guī)有機(jī)未來”是未來金融行業(yè)需要注意的關(guān)鍵。楊強(qiáng)指出,現(xiàn)有的數(shù)據(jù)安全法與相關(guān)規(guī)制一部分得以經(jīng)由技術(shù)實(shí)現(xiàn),另一部分卻需要來自法律、法規(guī)的保障!岸叩挠袡C(jī)、無縫結(jié)合是微眾銀行目前正在進(jìn)行的嘗試。”他補(bǔ)充,以增強(qiáng)整體決策過程的可解釋性與透明度,同時(shí)更具可監(jiān)管、可問詢及可追蹤性。
聯(lián)邦學(xué)習(xí)也可被視為促使AI更有效落地的一項(xiàng)技術(shù)。“它是AI發(fā)展的下一站,也同樣是大數(shù)據(jù)發(fā)展的下一站!睏顝(qiáng)說,其安全可信的數(shù)據(jù)保護(hù)措施下連接數(shù)據(jù)孤島的模式,將不斷推動全球AI技術(shù)的創(chuàng)新與飛躍。隨著聯(lián)邦學(xué)習(xí)在更大范圍和更多行業(yè)場景中的滲透及應(yīng)用,促進(jìn)企業(yè)級數(shù)據(jù)合作。
他稱,No-Free-lunch是一個(gè)亟待突破的瓶頸。數(shù)年前,計(jì)算機(jī)行業(yè)有過如多方安全計(jì)算等類似探索,但此類探索所產(chǎn)生的數(shù)據(jù)“安全鎖”很難被打開,難以激發(fā)大規(guī)模的數(shù)據(jù)運(yùn)用!霸O(shè)計(jì)出巧妙算法,使聯(lián)邦學(xué)習(xí)能應(yīng)對可能的安全隱患是其未來大規(guī)模運(yùn)用至金融場景的關(guān)鍵。”
最新評論