kiyoka.2004_12_19 RSSPLAIN

Related pages: !kiyoka.blog.list !kiyoka.blog.2004_12
55555555
5

[Sumibi] Net上の資料を集めてみると...

5

Net上の資料を集めてみると...

5

Net上の既存の日本語変換エンジンに対する評価(主に変換効率)を読んでいると、皆さん変換エンジンへの思い入れと期待が強いということがわかります。本当に僕みたいな素人が挑戦してみていいのかどうかと思ってしまいます。まあ、あんまり高望みはしていませんのでSumibiEXTを生暖かく見守ってください。僕が今持っている完成イメージでは (yc.el + SKK) / 2 という今までに無いユーザーインターフェースになる予定です。

5

 

5

今日の成果

5

今日の時点で、一応次のような変換ができています。「Internet jyou ni aru musuu no dokyumento wo ko-pasu toshite riyoushi , jisyo wo sodatete tanoshimu shin kankaku no kanji henkann enjinn no kaihatu wo mezashimasu .」→「Internet/上/に/ある/無数/の/ドキュメント/を/コーパス/として/利用し/,/辞書/を/育てて/楽しむ/親/ /の/感じ/変換/エンジン/の/開発/を/目指します/.」サッシのいい人はもうお分かりの通り、入力文が既に文節で区切られています。こうすることで、従来の漢字変換エンジンの代表的な誤変換原因である形態素解析誤りは理論上ありません。人間が指定しますので...。「そんなのズルい」と思われるでしょうが、多分これはこれで明快でわかりやすいのではないでしょうか。SKKを使ったことのある方には納得していただけると思います。ちなみに変換結果の 「kankaku」が「 」になるというのが笑えます^_^;

5

 

5

...comment disabled...