![]() | kiyoka.2004_10_17 | [RecentChanges] [AllPages] (Late |








辞書の構築ツールから作っています。SKKのラージ辞書をベースにしています。MySQLにSKKの辞書をそのまま読み込んで、コーパスからの単語の出現頻度を辞書に記録します。要するに単語の出現頻度DBを作っているわけです。変換エンジンは単純な1重マルコフ連鎖アルゴリズムを使う予定なので、bigram(連続する単語が連鎖して出現する頻度)も記録します。このままいくと、実際に変換アルゴリズムを試して遊べるのは、12月くらいになりそうです。急がず楽しみながらぼちぼち作っていっております。