kiyoka日記。NendoやSekkaの開発や、最近思うことなど
最新10件!kiyoka.blog   過去記事一覧!kiyoka.blog.list
[img]  
このブログを書いている人: 西山 清香(kiyoka) - twitter: @kiyoka
----
 
 
* kiyoka.2005_01_31[Sumibi] 今日の驚き。僕が教えたんじゃないからね。
** [本]確率的言語モデルを読む
[Amazon 4130654047]  言語と計算 (4) 確率的言語モデル: 北 研二, 辻井 潤一
ほぼ読みました。漢字変換エンジンを作るのにあたって大変参考にさせていただきました。特にSumibiはこの本で解説している内容をストレートに実装したようなソフトウェアです。(Sumibiは隠れマルコフモデルのような高級なモデルではなく単純なN重マルコフモデルを使っています。)
 
** [Sumibi]今日の驚き。僕が教えたんじゃないからね。
 
どこでおぼえたんだ……
utada hikaru
↓
宇多田ヒカル
やるじゃん。
 
kirisuto kyouto no hito
↓
キリスト教徒の人

kyouto no hito
↓
京都の人
 
comment (disabled)
----
 
 
* kiyoka.2005_01_26[Sumibi] object思考的入力方法
** なぜuimか?
ここで、『なぜuimか』という議論が集めてあるようです。僕はuimとscimの違いについて、まだはっきりイメージが捕めていません。
僕の様にこれから日本語入力メソッド作りに挑戦するひとにとってはフレームワークはひとつのほうが嬉しいです。
今のところ僕がMacOSユーザーなのでMacUIMにSumibiを統合してもらえればいいなと考えています。もうすこし勉強が進むまではuim等の議論に参加できません。頑張ります。
 
** object思考的入力方法
今日、Sumibiの入力方法として単語の入力にobject指向的な構文を使うというアイデアを思いつきました。次のような感じです。
単語をインスタンスと見立ててメソッドで変換のヒントを与えます。
 
単語の属性指定(オブジェクト思考言語風)
- xxxx.h   で xxxx を平仮名とみなす
- xxxx.k   で xxxx をカタカナとみなす
- xxxx.j   で xxxx を漢字仮名交じりとみなす
- xxxx.l   で xxxx をankのままで無変換とみなす
- xxxx.L   で xxxx を全角とみなす
- xxxx.num で xxxx を数字とみなす
 
例としては次のような記述ができます。
katakana.k to hiragana.h wo tadashiku shitei suru .
↓ 
カタカナとひらがなを正しく指定する。
 
他にもword.meanやword.lookup、word.google、word.whois、word.urlなどGoogle API 等の外部のSOAP系サービスと複合すれば楽しそうなことが出来そうです。
 
----< 通りすがり >----
> 僕の様にこれから日本語入力メソッド作りに挑戦するひとにとってはフレームワークはひとつのほうが嬉しいです。

そこでUnified Input Method APIですよ。
http://sourceforge.net/projects/unified-im-api/
----< kiyoka >----
通りすがりさんへ:ありがとうございます。教えていただいたAPIを調べてみます。実際にフレームワーク対応はEmacsクライアントを仕上げた後になりますが。とりあえず、MLに入ってwatchしていきたいと思います。
----< 田畑 >----
選択しないといけないのは面倒なんですが、現時点では、日本語以外も含めた多様な入力システムからuimやscimといった中間層への要求事項が明らかになっていないことが大きな課題だと思います。
そういった点からすると、現状のようにuimとscimが独自に機能を実現し、お互いの機能を取り入れていくという現状にはメリットがあると考えています。
またsumibiへの対応を実装することで、中間層と変換エンジンのインタフェースに問題が無いかを見ていただき、提案等をしていただければ非常に助かります。(私が最も避けたいのは、変換エンジン側からの発言が無いことによって中間層が適当な想定で設計され、変換エンジンの開発コストが上昇することです)

長々と書かせていただきましたが、sumibiの開発の継続と発展を心より祈っております。
----< kiyoka >----
田畑さんへ
なるほど。そのような問題意識をお持ちなのですね。教えていただいてありがとうございます。どちらかというとuimやscimに対して受け身的なスタンスで考えてしまっていました。今後実装が進んだ段階で提案させていただきます。
 
comment (disabled)
----
 
 
* kiyoka.2005_01_23[Sumibi] sumibi.orgを取得する
sumibi.org ドメインを取得しました。今のところお試し版 Sumibiエンジンは sumibi.org からCGIにて提供する予定です。
但し、ユーザーになってくれる方は、お試しとはいえ変換している文章がInternet上に漏れるのはイヤでしょうから、SSLでアクセスできるようにします。また、なりすましを防ぐための対策として正規のSSL証明書を取得する予定です。いくらなんでもこんなニッチなSumibi CGIを偽装するというサーバーは無いとは思いますが、一応セキュリティーは最大限確保しておいたほうが良いでしょう。いま流行のオレオレSSL証明書で運用というのは避けたいです。どうせSSL証明書を取るならということで、sumibi.orgを取得してしまいました。
ユーザーに「No config is good config」を体感していただくためには、サービス提供側ががんばらないといけないということですね。
いろんな面で多少維持費がかかってしまうので、sumibi.orgでdonation受けつけやAdsenseなどの広告を掲載させていただきます。
 
comment (disabled)
----
 
 
* kiyoka.2005_01_19[Sumibi] Sumibiエンジンの初運転
今、Emacsからsumibi.elを使って文章を書いています。残念ながらメチャメチャ適当なversionなので所々SKKの力を借りながら書いています。なんせ第一候補を有無をいわさず確定してしまうという手ぬきversionです。因みにsumibi.elはYC をベースに作っています。YCの作者の方、ありがとうございます。この場を借りてお礼申しあげます。なお、皆さんより人足先に炭火焼きを楽しんでしまっていることをお許しください。まだまだ沢山やることがあります。
 
comment (disabled)
----
 
 
* kiyoka.2005_01_11[Sumibi] Emacsクライアント検討開始
YCのソースを読みながら、どんなクライアントを作るか検討を始めました。
YCでいうところの(global-yc-mode 1) がメインの使い方になる予定です。YCのソースはすごく参考になります。YCの作者の方に感謝致します。(ちなみに、今もYCで書いています。)
炭火で肉が焼ける(肉リリースのこと)のはいつの日か...
どの肉の日になるかまだまだ分かりませんが、気長にお待ちください。フレッシュな肉だったらいいな。
 
 
----< とおりがかり >----
今年2005年はフレッシュな肉の日(2/29)はありませんよ。
----< kiyoka >----
とおりがかりさんへ。ほんとですね2/29はありませんね。というわkで、みんなの肉(3/29)を目指してがんばります。^_^;
----< Nelson >----
This "free sharing" of ifnoratmion seems too good to be true. Like communism.
comment (disabled)
----
 
 
* kiyoka.2005_01_10[デザインポリシー] No config is good config
直訳すると『設定が無いのが良い設定』という意味ですね。意訳すると『設定不要なモノが良いデザイン』でしょうか。
このポリシーは、自分の作ったソフトウェアをなるべく多くの人に試して欲しいと思っている人には重要なポイントになると思います。ポチさんところで知りました。高林さんが発信されているポリシーはいつも参考になります。
最近、有名タブブラウザSleipnirの作者の方とお話させていただいたのですが、彼もこのデザインポリシーの信奉者であることが伺えました。技術に明るくないユーザーにも使ってもらうとなると、特に重要になるのは当然ですね。
そういえば、以前僕がPRIMEを試してみようと思った時に、インストールが面倒だったので、試すのを躊躇したことを思い出しました。
 
[本] [Amazon 4873111366]
Google APIに興味があって買ってみました。
まだちゃんと見ていませんが、楽しいことができそうです。Sumibiと組み合わせると面白いことができたりして。 
ちなみに将来 Sumibiも Google APIのように SOAPによるAPIを提供することを考えています。
 
comment (disabled)
----
 
 
* kiyoka.2005_01_05[オープンソース] オープンソース参加を経済の言葉で考える
少しばかりオープンソースの世界に参加してきた僕の経験をもとに、オープンソースの世界に参加する場合のコツをお教えします。ポイントは投資と回収のバランスです。オープンソースに参加するには自分の使った時間または満足度が黒字化しているかどうかに思いを巡らせながら活動すると幸せな生活が送れるんじゃないかと思います。投資とは、日頃あなたが使用するソフトウェアを改善するために使う労力です。回収とは、そのソフトウェアを使って得られた生産性や満足度ということになります。もし、それが黒字化していればあなたは幸せでしょう。
一般にオープンソース開発やバグフィックス・テスト等はボランティアといわれますが、上記の用にコストとベネフィットという考え方に置き換えれば、開発者は受益者でもあるといえます。また、無数のオープンソースソフトウェアを大きなポートフォリオと考えるなら、一部のソフトウェアに投資して、別のソフトウェアから回収しても良いでしょう。問題は、「フリーライダー」と呼ばれる人々です。この人達は投資を行っていないにもかかわらず、先に利益だけを得ようとしています。人にもよりますが、これは精神衛生上幸せではないでしょう。ちょうどいい黒字バランスが幸せを生むのだと僕は考えます。
 
comment (disabled)
[nolist]