あたまがうにになる

2004年08月26日

人工無能を作ろう〜形態素解析

人工無能が辞書を作ったり、文章を再構成する為に、まずは形態素解析を行います。
形態素解析とは、文を意味のある最小の単位(品詞等)に分解する事を言います。
例えば「日本語って難しいです」と言う文を形態素解析すると
「日本語/って/難しい/です」といったように意味が通じるギリギリの範囲で分解されます。

 

今回は、このような形態素解析にChaSen(茶筌)を使います。
ChaSenを使うのに、言語処理などの特別な知識は必要ありません。
ChaSenに形態素解析をしたい文章を渡せば、形態素解析を行った結果を返してくれます。

形態素解析については、プログラムからChaSenを使う部分のソースを見るのが一番早いかもしれません。
ソースを見れば形態素解析をどう使うかは置いといて、とりあえず形態素解析は出来るようになると思います。

ここから先、ご利用のマシンへChaSen(もしくは別の形態素解析ツール)がインストールされてない場合、
殆ど意味の無い情報になる可能性が高いです。(私が解説する人工無能は形態素解析ツールに頼りまくりです)
人工無能を作る気は無いが、とりあえずサンプルプログラムを動かしたい方などは、形態素解析ツール(なるべくなら、解説の都合上ChaSen)をインストールしてみてください。

blank_space
投稿者 Lanタソ : 2004年08月26日 21:27 | トラックバック
 

形態素解析をちゃんと利用してるのは多いけど
分かち書きに形態素解析器を利用してる無能は少ないんじゃないかな。

Posted by: 酢鶏 at 2004年08月29日 10:01
 

ある日の事でございます。

Posted by: at 2008年07月20日 02:12
 
blank_space
コメントする

名前を保存しますか?






blank_space
パーツ
blank_space

Adds

blank_space

カテゴリー
blank_space

Link
blank_space