海量数据处理利器之Hash——在线邮件地址过滤
生活随笔
收集整理的這篇文章主要介紹了
海量数据处理利器之Hash——在线邮件地址过滤
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
一、需求
現(xiàn)在我們需要設(shè)計(jì)一個(gè)在線過濾垃圾郵件地址的方案,我們的數(shù)據(jù)庫里面已經(jīng)有10億個(gè)合法的郵件地址(稱為合法地址集S),當(dāng)有新的郵件發(fā)過來時(shí),要檢查這個(gè)郵件地址是不是在我們的數(shù)據(jù)庫里面,如果在,我們接收郵件,如果不在,我們就把它當(dāng)做垃圾郵件過濾掉。
總結(jié)
以上是生活随笔為你收集整理的海量数据处理利器之Hash——在线邮件地址过滤的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据挖掘之KNN分类
- 下一篇: 数据挖掘系列(1)关联规则挖掘基本概念与