Correcting and augmenting stemming 上面提到的词干器都是使用算法进行词干化,而不是通过词库进行词干化。语言中有许多的拼写规则,所以算法型的词干器是很难做到完美的,有时在不应该进行词干化的时候,也进行了词干化。 如果你发现了一些不应该进行词干化的词,你可以先使用KeywordMarkerFilt...