隨著銀行風(fēng)險的多元化和分散化,交易欺詐和洗錢活動在行為表現(xiàn)上千變?nèi)f化,但是銀行的風(fēng)控系統(tǒng)通常需要在幾十毫秒內(nèi)做出是否攔截交易的決定,這對風(fēng)控系統(tǒng)的準(zhǔn)確性和即時性提出了較高的要求。
在銀行風(fēng)控系統(tǒng)中,訓(xùn)練交易反欺詐模型的機器學(xué)習(xí)算法按照輸入數(shù)據(jù)的特征主要可以分為有監(jiān)督、半監(jiān)督和無監(jiān)督。三種類型的機器學(xué)習(xí)算法在特征數(shù)據(jù)要求和適用場景的區(qū)別如下:
有監(jiān)督式機器學(xué)習(xí)通過標(biāo)記銀行歷史交易作為標(biāo)簽數(shù)據(jù)來訓(xùn)練交易反欺詐模型,評估交易是否規(guī)范以及判斷是否需要攔截。無監(jiān)督式機器學(xué)習(xí)則是自動識別一組未標(biāo)記數(shù)據(jù),即通過自動提取數(shù)據(jù)集群的特征,將不在任何集群中的樣本標(biāo)記為異常值,然后用已知異常值訓(xùn)練交易反欺詐模型,由此,系統(tǒng)可以識別交易數(shù)據(jù)與正常模式的任何偏差。
無監(jiān)督式機器學(xué)習(xí)在一定程度上解決了銀行金融風(fēng)控面臨的依賴專家經(jīng)驗和標(biāo)記數(shù)據(jù)難獲取的問題。但是,無監(jiān)督式機器學(xué)習(xí)相對基于專家規(guī)則的風(fēng)控技術(shù)而言可解釋性較弱,有一定的誤報率,導(dǎo)致銀行在攔截用戶后較難辨別是欺詐團伙還是行為良好的團隊,而銀行攔截一個優(yōu)質(zhì)用戶的正常交易將直接影響客戶體驗。
易觀分析認為,在風(fēng)控準(zhǔn)確性和即時性的雙重要求下,半監(jiān)督機器學(xué)習(xí)能融合有監(jiān)督式低歧義的優(yōu)勢和無監(jiān)督式對數(shù)據(jù)結(jié)構(gòu)性特征的捕捉能力,更加適用于銀行的交易風(fēng)控場景,尤其是識別日漸興起的團伙欺詐交易。
半監(jiān)督式機器學(xué)習(xí)風(fēng)控應(yīng)用場景
半監(jiān)督式機器學(xué)習(xí)的特點是將未標(biāo)記數(shù)據(jù)與少量標(biāo)記數(shù)據(jù)結(jié)合使用,并將事件進行關(guān)聯(lián)分析,能更加有效地識別以下場景中的交易欺詐行為:
營銷反欺詐
利用半監(jiān)督式機器學(xué)習(xí),即使黑產(chǎn)黨降低同一IP下的執(zhí)行交易次數(shù),該自動化行為表現(xiàn)出的聚集性特征會被快速有效地識別處理。同時,半監(jiān)督式機器學(xué)習(xí)識別團伙欺詐并非基于單個相似特征,而是基于在某個維度下相似屬于正常用戶,但多個維度下出現(xiàn)不正常的聚集來評判是否存在風(fēng)險欺詐行為。比如,黑產(chǎn)黨通常利用群控技術(shù)操作大量真機進行欺詐活動,如果從單個事件來看,其設(shè)備與水平面成80度角擺放,設(shè)備各項信息也并無異常,但當(dāng)和其他事件進行關(guān)聯(lián)時,發(fā)現(xiàn)所有與水平面成80度角擺放的設(shè)備,其網(wǎng)絡(luò)信息屬性一致,那么銀行可以大概率斷定其為風(fēng)險異常事件。半監(jiān)督式機器學(xué)習(xí)在反薅羊毛場景下可以保證高準(zhǔn)確、低誤殺。
團伙開卡盜刷
商業(yè)銀行基于行內(nèi)的開戶信息、賬戶操作日志、銀行卡交易流水等,進行數(shù)據(jù)特征的創(chuàng)建。再利用已獲取的少量異常標(biāo)簽樣本,將數(shù)據(jù)特征導(dǎo)入半監(jiān)督機器學(xué)習(xí)模型,可以識別并剔除較多的正常交易,并且對判定為可疑的交易事件進行預(yù)排序和分類,再分配給不同的人工審核案件組去審查,優(yōu)化專家資源配置。
利用半監(jiān)督式機器學(xué)習(xí)技術(shù),銀行可以基于客戶開戶、網(wǎng)銀操作等行為,在銀行卡開卡階段提前檢測洗錢團伙和賬戶、加強識別倒賣銀行卡等團伙犯罪。
虛假信貸申請
在黑中介代辦的信貸申請中,欺詐者提交的若干個貸款申請都運用了一定的偽裝手法,比如該群組中申請人的個人信息(名稱、證件號、手機號、家庭地址、單位名稱等)均不相同,且該群組中申請貸款的時間分散在周內(nèi)的不同時間段內(nèi)。在一般的信貸審查中,很難發(fā)現(xiàn)這些看似不相關(guān)的貸款申請來自同一個犯罪團伙。
但是依靠半監(jiān)督式機器學(xué)習(xí)算法可以從數(shù)據(jù)在多個維度下的異常共性來挖掘出申請人的可疑共同點,比如:
該群組申請賬戶中大部分賬戶的家庭地址與征信信息中的家庭地址不一致,且部分申請中城市信息不一致;
每單申請過程中均出現(xiàn)登陸的GPS不唯一,甚至存在跨城市的現(xiàn)象;
不同申請之間都有登錄同一城市的GPS信息,且登陸的均為蘋果手機。
銀行可以通過申請信息在多個維度下出現(xiàn)不正常的聚集來評判是否存在虛假信貸申請的行為。
從應(yīng)用價值上看,半監(jiān)督式機器學(xué)習(xí)的欺詐群組檢測是從全局角度出發(fā),基于部分已知的標(biāo)記數(shù)據(jù)在高維特征空間分析用戶之間的關(guān)聯(lián),并自動挖掘異常團伙。
因此,要最大化輸出半監(jiān)督式機器學(xué)習(xí)在風(fēng)控場景下的應(yīng)用價值,易觀分析建議銀行建立“識別—排查—處置—反饋—優(yōu)化”風(fēng)控閉環(huán)管理流程,形成分階段排查、報告、迭代的體系。通過階段性新增正負樣本來調(diào)整半監(jiān)督式機器學(xué)習(xí)模型參數(shù),自動進行迭代優(yōu)化,再將優(yōu)化的模型進一步應(yīng)用到下一階段的預(yù)測當(dāng)中,從而使半監(jiān)督式機器學(xué)習(xí)算法基于風(fēng)險閉環(huán)管理流程釋放風(fēng)控場景下的技術(shù)價值。
同時,對于風(fēng)控應(yīng)用場景而言,需要一定程度的可解釋性來滿足監(jiān)管和業(yè)務(wù)的要求。易觀分析建議,銀行將半監(jiān)督式機器學(xué)習(xí)算法與專家經(jīng)驗結(jié)合應(yīng)用,一方面可以平衡可解釋性,另一方面也能降低機器學(xué)習(xí)對于計算基礎(chǔ)資源的成本消耗。
特征是將專家經(jīng)驗注入模型的重要手段,銀行可以將數(shù)據(jù)特征導(dǎo)入半監(jiān)督機器學(xué)習(xí)模型,以此來識別并剔除較多的正常交易。此外,銀行也可以通過明確攔截交易的規(guī)則在一定程度上限制機器學(xué)習(xí)模型產(chǎn)出的結(jié)果,降低誤報率。
更多閱讀推薦:
》》《數(shù)字經(jīng)濟全景白皮書》銀行數(shù)字化篇 重磅發(fā)布!
》》銀行業(yè)RPA趨向主動觸發(fā)流程,補足營銷場景執(zhí)行末端的渠道協(xié)同能力
》》銀行應(yīng)構(gòu)建主動式客戶體驗管理體系,助力客戶價值增長
微信掃描下方二維碼,每日推送更多有趣的數(shù)據(jù)&有料的報告,記得點贊哦!