海量数据处理利器之Hash——在线邮件地址过滤
生活随笔
收集整理的这篇文章主要介绍了
海量数据处理利器之Hash——在线邮件地址过滤
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
一、需求
现在我们需要设计一个在线过滤垃圾邮件地址的方案,我们的数据库里面已经有10亿个合法的邮件地址(称为合法地址集S),当有新的邮件发过来时,要检查这个邮件地址是不是在我们的数据库里面,如果在,我们接收邮件,如果不在,我们就把它当做垃圾邮件过滤掉。
总结
以上是生活随笔为你收集整理的海量数据处理利器之Hash——在线邮件地址过滤的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 数据挖掘之KNN分类
- 下一篇: 数据挖掘系列(1)关联规则挖掘基本概念与