【文本挖掘】反欺诈模糊匹配
生活随笔
收集整理的這篇文章主要介紹了
【文本挖掘】反欺诈模糊匹配
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
問:一個可以做模糊匹配的字段,同一行的數據需要和其他行的數據分別比對,除了循環,有沒有什么可以調高效率的方法。
方法一:數據量小的話,可以行列交換,矩陣運算
方法二:python內置map和reduce函數,處理速度大概是for的n倍,看數據復雜度
方法三:數據量大的話,建議用spark,大數據有大數據的方法,可以流處理或內存處理
方法四:如果是地址數據的話, 轉化成可計算的數值 可以用word2vec或者tf-idf
??對數據分析、機器學習、數據科學、金融風控等感興趣的小伙伴,需要數據集、代碼、行業報告等各類學習資料,可添加微信:wu805686220(記得要備注喔!),也可關注微信公眾號:風控圏子(別打錯字,是圏子,不是圈子,算了直接復制吧!)
關注公眾號后,可聯系圈子助手加入如下社群:
- 機器學習風控討論群(微信群)
- 反欺詐討論群(微信群)
- python學習交流群(微信群)
- 研習社資料(qq群:102755159)(干貨、資料、項目、代碼、報告、課件)
相互學習,共同成長。
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的【文本挖掘】反欺诈模糊匹配的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【特征工程】特征分箱
- 下一篇: 【模型迭代】模型迭代