kiyoka.2005_02_11 RSSPLAIN

Related pages: !kiyoka.blog.list !kiyoka.blog.2005_02
555555555555555555555
5

[Sumibi] sumibi.orgでサービス中のSumibi Serverの辞書について

5

sumibi.orgでサービス中のSumibi Serverの辞書について

5

sumibi.orgでサービス中のSumib ServerはSKK-JISYO.Lをスタート地点として次の文書を読みこんだものです。

5
村上龍氏のJapan Mail Media(過去記事) </li>
5
ThinkGNU(書籍) </li>
5
オープンソースソフトウェア(書籍) </li>
5
Yamagata Hiroo氏のWebサイト全体 </li>
5
Japan FAQのアーカイブ一式 </li>
5
PostgreSQL 8.1 リファレンスマニュアル </li>
5

このため、経済関係とIT関係の文章についてはそこそこの変換精度がでますが、それ以外の文章についてはほとんど駄目でしょう。

5

今後もSumibi Serverにいろんな文書を読込ませて行きますので、リクエストがあればツッコミお願いします。(但し、読みこみには大変な時間が掛かります。上記の文書には約3ヶ月書かっています T_T;)

5

とりあえず、αリリース版では技術系の人に触ってもらっていると思いますので、ソースコードのコメント入力等に便利なコーパスを選定しています。

5

使ってみた感想などメーリングリストのほうにお寄せ頂けると幸いです。( 変換候補の選択ができないのでユーザーインターフェース周辺はこれからなのですが……)

5

 

5

sumibi.orgでサービス中のSumibi Serverのセキュリティーについて

5

セキュリティーを考慮して、Sumibi Serverへの変換リクエストについては、変換内容をログに残していません。(厳密に解説すると、sumibi.elはHTTPのPOSTメソッドでリクエストを出し、Apacheログにはリクエストがcombinedフォーマットで記録されるのでPOSTデータはログに残りません。 )

5

これにより、Sumibiを普段の文章入力で試用してもらっても問題がないように設定しています。

5

但し、SSL証明書がCAcertの一番ランクの低いものを使っているため、sumibi.orgが偽装されていない保証は100%ではありません。

5

(Sumibi Server のようなニッチなモノを偽装する物好きな人がいる可能性は低いですが……)

5

 

5

...comment disabled...