【数据源】如何应用“紧急联系人”数据
【博客地址】:https://blog.csdn.net/sunyaowu315
【博客大綱地址】:https://blog.csdn.net/sunyaowu315/article/details/82905347
【原文鏈接】:https://mp.weixin.qq.com/s/a3_J5fsB2wwxXCM55lLUHw
正文前,請大家思考一個問題:一個借貸場景,如果我們沒有辦法驗證一條信息的真實性(例如:你沒辦法確認申請人是否真的結婚,家里是否真的有子女),那么,我們還需要申請人提供這一信息嗎?
相信對于這一問題,做業務的和做風控的會有分歧,做策略的和做模型的會有分歧,做信用的和做反欺詐的同樣會有分歧。業務通常會想:對于一條無法確認真實性的信息,如果填寫過于復雜,或者用戶覺得這條信息過于隱私,則會影響客戶的申請意愿,降低用戶轉化率。做信用和做策略的也會認為:我通過規則做決策,一定要基于真實信息,否則如何評估申請人真實的還款能力(信用)?
這話一點不錯,但其實從反欺詐的角度來講,用戶申請自填信息所表現出來的是客戶的一種意圖,或者說一種動機,是探測用戶心理的最好依據。在跟一個信用卡中心合作的項目中,我們拿到了很多客戶自填信息:住房情況,婚姻及子女狀況,常住地址,月收入,職位名稱等等。其實這些信息,此信用卡中心自己在做信用建模并評估給定額度的時候,也并不會使用,他們使用的全部是社保公積金中心、人行征信、學信網、法院執行等可靠來源的數據。記得黃姐姐人生中的第一個信用卡項目,就問了一個或許很多人都會問的問題:既然不會使用,那么,你為何還讓用戶填寫?信用卡中心的負責人說:為了要核實信息啊,我們call center在撥打電話的時候,會用自己的話術,去核實用戶填寫信息的真實性。如果有很大虛構的成份,那么我們是不會發卡的,不單單只看信用評分。
說到核實信息的話術,黃姐姐在一個call center圍觀了幾天,著實佩服。比如,在自填信息里你說,你的工作地點是在上海的徐家匯。那么,話務員會問:你的公司地址是上海徐家匯哪條路幾號?乘什么交通工具上下班?如果回答地鐵,就又會被問,那么是地鐵幾號線?在哪站上車?一共要花多久?如此一來,如果是偽造的信息,便很有可能會露出馬腳。當然,如果想做的天衣無縫,必然需要對所填信息做足功課(一個合格的中介,會教你如何應對電話回訪)。
回到主題,我們說,反欺詐建模和信用建模是有其不同側重點的,甚至有時候是剛好矛盾的。因為一個欺詐分子,會采用包裝完美的profile信息來偽裝,而這在信用評分卡中會被評高分,因為從profile信息來看,這確實是一個優質用戶啊!但從反欺詐模型評分中,則不一定表現良好了,因為看起來,這個profile信息里,似乎有包裝和偽冒的痕跡。也就是,信用認為,一個這樣的“優質用戶”應該放款,他們尋找的就是優質用戶;而反欺詐則認為,這樣的“優質用戶”可能反而會成為重點關注對象,一個欺詐分子,目的不就是想把自己包裝得特別優質嘛!這也是文章開頭,黃姐姐問題的來源:信用評分,輸入模型的數據最好是被驗證的真實信息,否則可能會將某些騙子誤判為優質用戶。而反欺詐模型,則需要更多的揭露申請人意圖的profile數據和behavior數據。
好,那么,黃姐姐回答一下文章開頭的問題:如果是想做反欺詐,那么,則有必要讓申請人提供這一信息。
我們今天的主角是“緊急聯系人”,對于不對申請人信息作電話核實的產品中,緊急聯系人通常只有在催收時才會使用到,這著實有些浪費了。那么,今天,黃姐姐就羅列一些對“緊急聯系人”可能的使用方式。
與緊急聯系人有關的信息通常包含三個:緊急聯系人姓名,與申請人關系,緊急聯系人手機號。
關系譜圖:關系譜圖的實體節點為手機號,可以將所有申請人手機號和緊急聯系人手機號作為節點,做一個非常簡單的關系譜圖。在制作這一關系譜圖時,我們需要搜集以下信息:緊急聯系人是否也是本產品的申請人,可以用代碼來做標記,例如:0-未申請;1-通過且未逾期;2-申請且拒絕;3-通過且逾期(這里也可以加入外部采購黑名單)。這里舉個例子:
好,那么幾個問題來了:
(1) 對于丁和己兩位申請人,哪位應該通過呢?還是都拒絕?
(2) 如果我們在做營銷推廣,應該給戊推送廣告嗎?
(3) 如果我們想做用戶下沉,那么,乙有機會接受重新審判嗎?
答案見仁見智,判斷方式也多種多樣。從純粹的統計角度來看,這6個人的群組,里面有1個人被確認為壞人(假設評分1.0分),1個人疑似壞人(假設評分0.5分),1個被確認為好人(假設評分0分),那么其hurt ratio(好人壞人比)如果按照人數來計算,為1:1,如果按照分數來計算,則為1:1.5 = 2:3,也就是無論從哪個口徑來計算,都應該把丁和己都拒絕。但事實上,己可能只是一個FP(誤傷),丁會出現壞賬的概率更大。這也是為什么我們不建議從一個維度就把人判死刑的原因。對于第二個問題,也就是如果戊也來申請,那么他將遇到跟己類似的審判問題。第三個問題,由于乙和丙僅是“朋友”關系(普通關聯欺詐),所以相比于丙丁的“夫妻”關系(直系關聯欺詐),或許應該給到乙重新審判的機會,更可況其還有甲這個好人父母。只是需要從更多維度來考察,必要時加入人工審核。
親密度:在判定親密度的時候,除了要看關系,如果能拿到通訊錄和通話詳單還應做如下判斷(拿甲和乙舉例):
(1) 甲的通訊錄里是否有乙,乙的通訊錄里是否有甲,備注名稱是什么;
(2) 甲和乙的近半年/一年的通話總頻率,通話趨勢。
比如,乙說,我的緊急聯系人是甲,但是甲的通訊錄里并沒有檢索到乙,那么,是否甲乙的關系并未如乙說得那般親密?再比如,我們通過對甲乙通話頻率按月/周切片,發現甲乙只有在近一個月才開始頻繁通話,且每次通話時長都小于10秒,那么,是否甲乙在偽造親密關系?(特別說明:由于微信的普及,通話不頻繁已經無法表示其關系不親密了,因為其可能更喜歡用微信語音交流。但對于那種近期才通話頻繁的行為,則應特別注意。)此外,乙說其與甲是“父母”關系,但其備注信息卻標記成“貸款中介王經理”或者“客戶李小姐”,那么,你還相信乙所聲稱的親屬關系嗎?
還有一些其他偽裝關系的笑話:比如黃姐姐在文章《玩轉手機號碼,讓犯罪團伙無所遁形》中提到的,有一個團伙把10086備注為“爸爸”,然后在緊急聯系人處統一填寫了“父母”關系,并把這位“爸爸”設置成緊急聯系人。這一點,真的要提醒一下產品經理,一定要記得對手機號碼的合法性做校驗。還有一些更幼稚的漏洞,甲說跟乙是父母關系,甲的年齡是25歲,過了一個小時,乙也過來申請產品,通過身份證解析,我們發現乙的年齡只有26歲,對此黃姐姐想問一句,你們到底是誰養育了誰?在年僅一歲的時候?還是說,是養父母關系?此外,還有那種特別不走心的,在婚姻狀況一欄填寫“未婚”,在緊急聯系人關系處選擇“夫妻”關系。喂喂喂,小朋友,法律可是不會承認你把你的男/女朋友定義成“夫妻”的哦!
地址解析比對:通過對緊急聯系人手機號中間四位編碼的解析,我們可以得到其手機號歸屬地。這一歸屬地,可以與申請人的出生地、戶口所在地、常住地址、卡寄地址、申請人手機號歸屬地、IP所在地、GPS所在地、公司地址一一比較,也可以寫成固定的比對組,例如,如果關系為父母,則比較(緊急聯系人手機號歸屬地,申請人出生地),(緊急聯系人手機號歸屬地,申請人手機號歸屬地)兩組;如果關系為“同事”,則比較(緊急聯系人手機號歸屬地,申請人公司地址)一組等等。這里要特別強調,比對結果若不match,并不能說明這個用戶一定壞,只是需要特別留意,必要時加入人工審核。
緊急聯系人往往比通訊錄和通話詳單更容易處理,如此唾手可得的觀察角度,條件允許的情況下,各位千萬不要放棄嘗試。
黃姐姐最近在做的一個項目,客戶項目組一位同事堅持未來要把“緊急聯系人”去掉,理由是會影響用戶轉化率。而在另一邊,從輿情監控信息看,由于經濟大環境每況愈下,黑中介們在不斷降低手續費來招攬生意,給他們的客戶讓利。黃姐姐對此真是痛心疾首,如果客戶爸爸能夠看到這篇文章,望仔細斟酌,收回成命!拜謝!
總結
以上是生活随笔為你收集整理的【数据源】如何应用“紧急联系人”数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python】url基础:urllib
- 下一篇: 【风控模型】Logistic算法构建标准