2014.04.24 Development

前回は「ラムネマンゴーココナッツパフェ」をmecabが単語に分けてくれない、という問題が未解決。

mecabのオプションでそれっぽいのがないかなと見てみる。

$ mecab -h

を見ながらそれっぽいのを探してみたが、–levelがそれっぽいかなと思ったけど違う感じだし、–level 1と2で–margnalとか–nbest使ったら?って言われるからそっちも試してみるが正直うまくいかない。ラムネマンゴーココナッツパフェはラムネマンゴーココナッツパフェのまま。

そこで色々調べているとChasenとKakasiとMeCabの形態素解析・わかち書きの比較っていうサイトが出て来て、ブラウザ上でそれぞれを試せるのだけど、Chasenならラムネマンゴーココナッツパフェを分割できることが確認できたのでChasenを次は入れてみる。

mecabは保留。