技術人生系列——新趨勢:圖技術賦能貸款資金流向追蹤
日期:2020-05-18
人民銀行開出“天價”罰單
今年年初,某銀行(xing)因(yin)為(wei)被(bei)人行(xing)開出超兩千萬元的“天價”罰單上了熱(re)搜(sou)而(er)被(bei)廣泛討論。它被(bei)處罰的主要原因(yin)為(wei)未對(dui)客(ke)戶進行(xing)盡調,并(bing)涉(she)及房地產資金(jin)運(yun)作行(xing)為(wei)違法違規(gui)。
事實上(shang),人行對資金流入房地產的嚴管(guan)已經(jing)持續多年,僅過去(qu)兩年就有(you)4家銀行及(ji)金融(rong)機(ji)構因為涉及(ji)相關問題而被處以千萬元的罰款(kuan)。
種種事實(shi)都在釋放(fang)著這樣的信(xin)息:資金(jin)(jin)追溯是每一家銀行和(he)金(jin)(jin)融機構(gou)都必(bi)須去面對和(he)解(jie)決(jue)的問(wen)題(ti)。
本期技術人生,我們就來解析一下這種新趨勢:圖技術賦能貸款資金流向追蹤。
海量資金流水數據,傳統方法難以追蹤
傳統的關系型(xing)數(shu)據(ju)(ju)庫(ku)以表(biao)格的方式儲存(cun)和呈(cheng)現數(shu)據(ju)(ju),十分抽象。
銀行流水(shui)示意(yi)
銀行每月交易流水都達(da)百(bai)萬到(dao)百(bai)億(yi)的(de)數量級。使用傳統的(de)查(cha)詢方(fang)法在(zai)茫茫數據中搜(sou)尋(xun)蛛(zhu)絲馬跡(ji),不僅耗(hao)時耗(hao)力(li),最(zui)終結果也未必理想,這成為了許多銀行等金融機構開展資金追蹤的(de)障礙。
圖技術+規則:追蹤資金流向新思路
1、簡(jian)單直觀的圖(tu)數據庫
而圖分析則能很好地解決數據不直觀(guan)、難以追(zhui)蹤的(de)問(wen)題(ti)。假設在關系(xi)型數據庫中有下表所示的(de)一(yi)段交易流(liu)水:
序(xu)號 |
…… |
轉(zhuan)出方(fang) |
收入方 |
金(jin)額(RMB) |
…… |
…… |
…… |
…… |
…… |
…… |
…… |
XXXX |
…… |
公司A |
公司a |
2,000,000.00 |
…… |
XXXX |
…… |
公司A |
公司b |
3,000,000.00 |
…… |
XXXX |
…… |
公司A |
公司c |
3,000,000.00 |
…… |
XXXX |
…… |
公司a |
公司B |
1,980,000.00 |
…… |
XXXX |
…… |
公司b |
公(gong)司B |
2,960,000.00 |
…… |
XXXX |
…… |
公(gong)司c |
公司B |
2,980,000.00 |
…… |
…… |
…… |
…… |
…… |
…… |
…… |
關系型數據庫(ku)存(cun)儲數據示意
這些數據(ju)在圖分析中,將有完全不同的(de)存儲方式。
以TigerGraph圖分析為例:將交易(yi)過程中(zhong)(zhong)的(de)(de)每(mei)一(yi)個實體(銀行或(huo)公(gong)司)作(zuo)為節點(dian)、每(mei)一(yi)條交易(yi)流水作(zuo)為兩點(dian)之間(jian)的(de)(de)一(yi)條邊,我們便能構建一(yi)張包(bao)含所有(you)交易(yi)數(shu)據的(de)(de)關聯圖,其中(zhong)(zhong)的(de)(de)數(shu)據將被存儲在圖數(shu)據庫(ku)中(zhong)(zhong)。
圖(tu)數(shu)據庫存儲(chu)數(shu)據示意
可以看到數據中(zhong)的“公司A”、“公司B”都從三條數據合(he)并(bing)為(wei)(wei)了一個節(jie)點,轉賬(zhang)行為(wei)(wei)成為(wei)(wei)了帶數據的有向邊,利用(yong)點邊關系即可清(qing)晰(xi)地描述(shu)實體(ti)間的交易行為(wei)(wei)。
并且通過構建圖(tu),我們發現公司(si)A轉出的(de)金額和(he)公司(si)B收(shou)入的(de)金額接近,有助于業務人(ren)員(yuan)對兩公司(si)之(zhi)間的(de)交(jiao)易行為進行進一步甄別和(he)判斷,而這在傳(chuan)統的(de)關系型數據庫(ku)中是很(hen)難直接看(kan)出的(de)。
人腦天生就對圖更加敏感(gan)。以(yi)圖的(de)形(xing)式進行數據(ju)存儲,構建實體之間的(de)關聯關系,這樣的(de)方法符合人類認知數據(ju)的(de)直覺。
2、基于圖的資金流向追蹤
我們利用TigerGraph圖技術,構建知識圖譜(以圖的形式存儲)并設置業務規則以進行資金流向查詢和追蹤。
存儲實體和交易數據的圖分析示意
假(jia)設根據業(ye)務(wu)人員的(de)經驗(yan),如(ru)果(guo)申請貸款(kuan)的(de)公(gong)(gong)司在(zai)貸款(kuan)發放后的(de)短時間內(nei)(例如(ru)3天內(nei))就(jiu)將款(kuan)項(xiang)大部分(例如(ru)80%以上)轉出公(gong)(gong)司,那么這家公(gong)(gong)司極有可(ke)能(neng)將款(kuan)項(xiang)用于購買(mai)房產:
采用圖(tu)技術,我們(men)可(ke)以(yi)將以(yi)上(shang)這項特征(zheng)總結(jie)為一條規則,將它編(bian)寫為查詢:
在全景知識(shi)圖譜上設置(zhi)查詢條件(jian):1、發(fa)放貸(dai)款與轉出交易的時間差為3天內;2、轉出的金額(e)總額(e)大于(yu)等于(yu)貸(dai)款發(fa)放金額(e)的80%。編寫代碼后在知識(shi)圖譜上運行,就能輸出我們想要(yao)的結果。
3、基于(yu)圖的優勢(shi)
相比基于關系型數據庫的查詢,TigerGraph圖查詢的條件設置直觀且簡便,無論從圖形上還是業務邏輯上,都有較強的可解釋性。
關(guan)系型(xing)數(shu)據(ju)庫目前尚(shang)無法解(jie)決(jue)數(shu)據(ju)不足的(de)(de)問題。而利用(yong)圖技術,即(ji)使是在數(shu)據(ju)量不足的(de)(de)情況下,我們(men)也能將業務人(ren)員的(de)(de)經驗總結(jie)為(wei)更多的(de)(de)規則(ze),編寫多種查(cha)詢(xun),使查(cha)詢(xun)輸出的(de)(de)結(jie)果具有更高的(de)(de)覆(fu)蓋度,有利于業務人(ren)員進行資金(jin)的(de)(de)追(zhui)蹤和監(jian)控。
圖技術在各場景中的應用探索
除了追蹤資金(jin)流(liu)向,圖(tu)還能有(you)效地搜(sou)索鏈(lian)路(lu)、回路(lu)等結構,對反(fan)金(jin)融(rong)欺詐場(chang)景的(de)業務應用(yong)具(ju)有(you)天然的(de)優(you)勢。在發現洗錢鏈(lian)路(lu)、套現團伙(huo)等場(chang)景中,圖(tu)都有(you)出色的(de)表(biao)現。
發現洗錢資(zi)金(jin)回路示意
在信用卡的套現偵測案例中,我們采取多部圖及高密子圖偵測等方法,基于百萬級的數據量進行查詢代碼的運行。相比傳統查詢方法,圖技術將代碼運行時間從2-3周縮短為1小時,輸出結果覆蓋的黑樣本從總量的58%提高到77%,運行效率和結果覆蓋率都有顯著提升。
近些(xie)年,我們在(zai)基(ji)于(yu)圖的算法研發和深(shen)度學習(xi)挖掘方(fang)面做了諸多(duo)探索,它們能夠發現一些(xie)人(ren)工無法歸納的特征和結構(gou)。結合(he)業務(wu)人(ren)員的經驗,從(cong)而得出更多(duo)有用(yong)的結論。
我們(men)還將持續推出圖(tu)技術(shu)在(zai)各類應用(yong)場景(jing)中的深度解(jie)析,歡迎(ying)持續關注!