Home » スタッフBlog » 「MeCab」を使ってみました

「MeCab」を使ってみました

category : スタッフBlog 2016.7.1 

技術部の小松です。

4月入社の新入社員です。
研修が終わり先輩の指導の下、プロジェクトに就いています。
分からないことばかりですが、毎日新しいことを知れるのはおもしろいです。

今回の記事は、「MeCab」についてです。
「MeCab」はオープンソースの形態素解析エンジンで、
文章を「形態素」と呼ばれる言語の最小単位に分解してくれるものです。
ちなみに、海藻の和布蕪(めかぶ)は、開発された方の好きな食べ物らしいです。

仕事で使っているわけではありませんが、おもしろそうなのでいじってみました。
使うには、「MeCab」本体と参照する辞書をインストールする必要があります。
起動後、例えば以下のように文章を入力すると、

画像1

このように、分解してくれます。
ただ、辞書をもとにして解析するので、辞書に登録されていな言葉は認識できません。

画像2

そこで、辞書に新たに単語を登録することができます。
登録すると、

画像3

このように正しく分解できました。
この技術は、webサイトの検索などに用いられています。

タグ

サイト内検索

Copyright(c) 2016 IT-TERA All Rights Reserved.