[Sumibi] 辞書構築ツールからすこしずつ開発中
** 辞書構築ツールからすこしずつ開発中
辞書の構築ツールから作っています。SKKのラージ辞書をベースにしています。MySQLにSKKの辞書をそのまま読み込んで、コーパスからの単語の出現頻度を辞書に記録します。要するに単語の出現頻度DBを作っているわけです。変換エンジンは単純な1重マルコフ連鎖アルゴリズムを使う予定なので、bigram(連続する単語が連鎖して出現する頻度)も記録します。このままいくと、実際に変換アルゴリズムを試して遊べるのは、12月くらいになりそうです。急がず楽しみながらぼちぼち作っていっております。
 
** tDiaryのトラックバックスパム?
kiyoka日記に変なトラックバックが来るようになりました。どうやってリダクションするのでしょうか。もうちょっとtDiaryを使いこなさないと...
 
[comment]