发布网友 发布时间:2022-04-25 01:41
共1个回答
热心网友 时间:2023-10-19 23:07
这个只能谈谈原则,没办法谈具体算法(我也不懂哈)。比如有人在stackoverflow上提问后,被顶得最高的答案是:This is the million dollar question, and if it were able to be answered on stackOverflow, then everyones spam filter would be as effective.主要原则有四条:1、用户帮助 Gmail有自己的反垃圾邮件算法,但算法总不能100%保证垃圾邮件被拦截,偶尔还是会有垃圾邮件塞进了用户的收件箱,这时候就需要用户配合。当收件箱收到垃圾邮件时,用户点击“Report spam”就非常重要;同样,当Gmail不小心将正常邮件放到垃圾邮件箱时,用户点一下“Not spam”也很重要。依靠用户的帮助,当以后再收到类似邮件的时候,Gmail将更加智能地判断垃圾邮件和正常邮件。用户对这两个功能用得越多(而非简单地删除或捞回到收件箱),系统越智能。2、快速适应 Google搜索的计算能力也能对判断垃圾邮件起到帮助作用。网络上一旦有新的垃圾数据出现,Google搜索的计算网络可以帮助Gmail系统自动适应新的垃圾数据的模式,从而过滤类似数据的邮件,提高垃圾邮件识别率。3、基于Google全体力量 Google内部有很多产品团队,每个团队或多或少都会为反垃圾做出贡献。比如,Google图书搜索(Google Book Search)项目的核心技术是视觉特征识别(OCR, optical character recognition)技术,相信大家都收到过那些将文字做在图片上的垃圾邮件吧?利用OCR可以加强Gmail对图片垃圾邮件进行识别,从而过滤掉类似的垃圾邮件。4、强大的验证系统 许多网络邮件服务都有验证系统来判断发件人是否可疑。Gmail支持多个验证系统,包括SPF (Sender Policy Framework), DomainKeys, and DKIM (DomainKeys Identified Mail),所以Gmail可以判断你的邮件究竟来自哪里,防止某些伪装成合法邮件的垃圾邮件被发到收件箱。最后再附张图: