如何使用Mecab Tokenizer分詞

Mecab是最被廣泛使用的日本語分詞器,我在不同的公司與不同的專案中都可以看到它的身影;原作者在日本Google工作。Mecab的Github似乎沒在維護了,但這也無損它在各個大大小小專案中的地位。

我曾經在專案開發之前,比較過幾個不同的分詞器,最後發現Mecab的速度極快,分詞結果佳,又因為它廣泛地被使用,網路上可以找到很多相關的sample code和文件,所以成為專案開發上的首選。

Continue reading