!kiyoka.blog.2004_10 RSSPLAIN

Related pages: !kiyoka.blog.list
24325555551555555555515
2

kiyoka日記。NendoSekkaの開発や、最近思うことなど

4

最新10件!kiyoka.blog   過去記事一覧!kiyoka.blog.list

3

kiyoka.blog_header 

2

このブログを書いている人: 西山 清香(kiyoka) - twitter: @kiyokaEXT

5

5

 

5

 

5

kiyoka.2004_10_31[Sumibi] 辞書構築ツールが形になってきた

5

SKKのラージ辞書を出発点に辞書を鍛え上げています。今のところ  Linux JF EXT と  JMM EXT (村上龍のメールメディアです)  と他少々...を読み込んで Linux関連ネタと政治経済ネタに強くなってきました。肝心の変換エンジンの方は やっとちょっとずつ 遊べるようになって来た段階です。早くEmacsから普通に使えるようにして自分で使ってみたいと思います。2chをたくさん読み込んだらどんな不良エンジンができるのかとか興味は尽きないです。多分、今この日記を読んでいる方は、どんなものを作っているのか全貌が全く見えないと思いますが、ある程度形がまとまってきたら sourceforge.jp に開発拠点を移してやって行こうと思います。まだアイデア検証段階なので、ある程度面白いものにしてからデビューさせたいと思っています。

5

 

1

comment (disabled)

5

5

 

5

 

5

kiyoka.2004_10_17[Sumibi] 辞書構築ツールからすこしずつ開発中

5

辞書構築ツールからすこしずつ開発中

5

辞書の構築ツールから作っています。SKKのラージ辞書をベースにしています。MySQLにSKKの辞書をそのまま読み込んで、コーパスからの単語の出現頻度を辞書に記録します。要するに単語の出現頻度DBを作っているわけです。変換エンジンは単純な1重マルコフ連鎖アルゴリズムを使う予定なので、bigram(連続する単語が連鎖して出現する頻度)も記録します。このままいくと、実際に変換アルゴリズムを試して遊べるのは、12月くらいになりそうです。急がず楽しみながらぼちぼち作っていっております。

5

 

5

tDiaryのトラックバックスパム?

5

kiyoka日記に変なトラックバックが来るようになりました。どうやってリダクションするのでしょうか。もうちょっとtDiaryを使いこなさないと...

5

 

1

comment (disabled)

5