-
答案 1:
一般工具使用的都是条件随机场CRF的模型,主要的区别会在训练层面上。 -
答案 2:
我们做的LJParser,在业界用的非常好。很高的评价,建议试用!并提出宝贵意见:lingjoin.com/download... -
答案 3:
我提供一个笨但却在实际中可以生效的思路。其实很简单,就是把文档集合里的文档两两比较,找出来共同的字串,这样很快就可以建立一个词汇备选集合。再对该集合作适当的处理,如去除停用词,等等。 这个备选集合可以成为下一步工作的起点,后面应该有很多方法可以采纳。 -
答案 4:
学术上研究用CRF,然后着重在特征选择上下功夫,取得的效果还不错。很久没看相关论文了,不知道是否有更好的模型或者方法? 实际应用当中,主要应该采用的是挖掘querylog 和用户点击的方法更为实用,目前微博很火,很多新词都来自微博,基于微博的新词发现也是一个不错的方法。
有哪些比较好的新词发现方案?
2012-01-19 19:38:32 来源: 点击:
相关热词搜索:
上一篇:京东商城拒绝沃尔玛控股,1 号店因此获得沃尔玛橄榄枝,你怎么看?
下一篇:王功权为什么要和王琴私奔?家庭不要了么?老婆不要了么?孩子不管了么?