Porter Stemming Algorithm
生活随笔
收集整理的这篇文章主要介绍了
Porter Stemming Algorithm
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
所谓Stemming,可以称为词根化,这里有个overview。在英语这样的拉丁语系里面,单词有多种变形。比如加上-ed、-ing、-ly等等。在分词的时候,如果能够把这些变形单词的词根找出了,对搜索结果是很有帮助的。Stemming算法有很多了,三大主流算法是Porter stemming algorithm、Lovins stemming algorithm、Lancaster (Paice/Husk) stemming algorithm,还有一些改进的或其它的算法。
转载于:https://www.cnblogs.com/codingmylife/archive/2012/11/06/2756686.html
总结
以上是生活随笔为你收集整理的Porter Stemming Algorithm的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: Oracle 分类统计sql
- 下一篇: msgrcv函数