欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

CRF++ 特征工程

发布时间:2025/3/21 编程问答 28 豆豆
生活随笔 收集整理的这篇文章主要介绍了 CRF++ 特征工程 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

Name Entity Recognition(命名实体识别) - 知乎

特征除了人工的方式还可以用深度学习的方式提取

可尝试的特征:

1.Bag of word features

--当前词:Colin

--前后词:prefessor,proposed

--bigram: Prefessor Colin,Colin proposed

2.词性相关的

--当前词:名词

--前后词:名词,动词

3.前缀 or 后缀

当前词:Co,in

前后词:pr,ed,or

4.单词特点

--词长

--是否包含大写?

--统计多少个大写?

--是否包含"-"

--是否包含数字

5.stemming(可以先用统计的算法得到) + 单词特征

6.句法特征

--语法(句法分析 ,Parsing)

通过cky(动态规划)算法获取语法树

--依赖关系(Dependency Parsing)

总结

以上是生活随笔为你收集整理的CRF++ 特征工程的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。