!kiyoka.blog.2009_02 RSSPLAIN

Related pages: !kiyoka.blog.list
25525555555555555555555555555555555505555555555555555555555555555555555055555555555555510555555555555555555555555555555555555555555555550555555555555555555555555555555555555555555555430555555555555555555555555555555555555555555550555555555555555555555505555555555555555555555555505
2

kiyoka日記。NendoSekkaの開発や、最近思うことなど

5

最新10件!kiyoka.blog   過去記事一覧!kiyoka.blog.list

5

kiyoka.blog_header 

2

このブログを書いている人: 西山 清香(kiyoka) - twitter: @kiyokaEXT

5

5

 

5

 

5

kiyoka.2009_02_28[言語]  そろそろオレ言語でもやっておくか(5)

5

 

5

過去の記事の続き

5
 kiyoka.2008_09_23[言語] そろそろオレ言語でもやっておくか(4)
5
 kiyoka.2008_09_03[言語] そろそろオレ言語でもやっておくか(3)
5
 kiyoka.2008_08_31[言語] そろそろオレ言語でもやっておくか(2)
5
 kiyoka.2008_08_09[言語] そろそろオレ言語でもやっておくか(1)
5

 

5

LispのS式に対する不満が昔から有るが解決が難しいという話。

5

Algol系の文法でラップしてしまえば、S式を直接使わずにS式のパワーが引きだせるのでは無いかと考える人は多いと思う。

5

過去にもトライしようとして失敗した人が多数。死屍累々。

5

でも、イバラの道に挑むバカ(良い意味でのバカ)がもっといてもいいじゃないかとも思う。

5

で、自分はどうなんだ、トライする気はあるのかと言われると、ちょっと及び腰であった。

5

 

5

 

5

そんな中、Shibuya Lispの発表をニコニコで見ていたらこんな発表を見つけてしまった。(リンク:Shibuya.lisp テクニカルトーク #1 ニコニコ動画にて動画公開!EXT)

5

イバラの道を進んで最後には、実際の業務に適用してしまった人。

5

これは凄い。

5
 
5

 

5

こういう活動は表には出てこないけど絶対にどこかで繰返されていると感じた。

5

他にもこんなアプローチも。

5
 
5

yuumi3だ。実際に動く所を見るとこのアプローチもありかなと思う。

5

どんなものになるのか楽しみだなあ。。

5
 [参考:yuumi3のブログ記事]
5
 (S-Expression for Ruby) ファンクション倶楽部2008秋イベント LT - yuum3のお仕事日記EXT
5
 S-Expression for Ruby 解説 - yuum3のお仕事日記EXT
5

 

0

comment (disabled)

5

5

 

5

 

5

kiyoka.2009_02_22[プログラミング] Key-Value Store勉強会に行きたかった...

5

1-1208707554nqU5

5
 Key-Value Store勉強会に行ってきました - blog.katsuma.tvEXT
5
 greeさんで開催されたKey Value Store勉強会に行ってきました。時間にして
5
 4時間超え、内容も国内のKey-Value Storeなソフトウェアの最前線の話ばかり
5
 で相当なボリューム。以下、メモってたのを残しておきたいと思います。
5

それにしても、このメモすごい情報量。

5

 

5

自分の興味としては、Key-Valueストレージエンジンの実装よりも、Key-Valueのデータベースの応用事例の方にある。

5

リレーショナルDBなら事例は山ほどあり、論理設計、物理設計ともに設計手法も確立している。

5

Key-Valueの場合はどんな分野で使えるんだろう。

5

例えば、Sumibi.orgをTokyoCabinetベースで作るとなると、どんな設計になるのかなとか。

5

もしかしたら、いまMySQLにメモリ3GByteも割当てているけどTokyoCabinetなら圧縮がかかってメモリ節約出来るんだろうかとか。

5

はたまた、一般的なCRMをKey-Valueで作るとどんな点に気を付けないといけないのかとか。そもそも、そういう分野には向いていないのではないかとか。

5

たぶん将来はAmazonのインフラ上で作品を作りたいと思っているので、この辺勉強しないといけないなと思っていた所。

5

作品を作る時は、KahuaのObject DBをAmazon S3とかDynamo対応する方向なのかなと漠然と思っているけど、もっと勉強すると各エンジンのトレードオフとかも肌で分かるようになるのかな。

5

 

5
 KVS 勉強会に出て、自分でも書いてみたいなと思ったり。 - 生駒日記EXT
5
 かな漢字変換的にはやはり key-value store (hash 的なもの)ではなく Trie
5
 があるといい(common prefix search が使えると検索効率がよい)のだが、やっ
5
 ぱり自分で1回は書いておいたほうがいいのだろうなー、と思った。いつになる
5
 か分からないけど……。
5

id:mamorukEXTさんも書いておられるように『自分で1回は書いておいたほうがいいのだろうなー』という気持もあるけど、自分はWebアプリケーションを作るほうに時間を使いたいのでちょっとそこまで時間はかけられないかなと思ったりもする。

5

ちょっと自分はRDBとSQL脳に傾いているのでもっと引出しを増やす意味でもいろいろ見ておこう。

5

 

5

追記:Key-Value Store勉強会については首藤さん所が、リンクが沢山で便利。

5
 Shudo's Notes (2009/2)EXT
5

 

5

 

5

COMMENTmamoruk

ChaIME は TokyoCabinet ベースですが、8000万(bigram)+200万(unigram)でコストは int で持っていて、全部でちょうど 2GB 程度のメモリ消費量です。Tx で作ったこともありますが、せいぜい1.6GBくらいだった記憶があり、Tx は TokyoCabinet と比べると辞書引きがかなり遅いので、安直には TokyoCabinet でいいんじゃないかなという気はします。ただ、やはり辞書引きでもかな漢字変換だったら文頭から引くので、上にも引用されているように、Trie だったら検索回数を抑えられるので、筋的には Trie で作るのがいいんじゃないかなーとは思います。Darts もあれば Tx もあるので、勉強という以外には、あえて自分で書く必要はないですね……。

Key-value にしても、自然言語処理を含めて多くの場合データアクセスには局所性とか類似性があって、この単語を引いたら次はこれを引きやすいとか、もしくは全体の1割とか数%のデータだけはやたらアクセスが高く、残りはすごく頻度が少ないとか、そういう特徴があるので、この特徴をうまく使って負荷を分散するのが勘所でしょうね。よく使うのだけメモリに置いて、あとはディスクとか、ネットワーク上に置いとくとか、階層的な構造にするのが一般的でしょうが……(そのあたり考えないで2GBぼーんとメモリに確保してなんとかなるというのも、ちょっと前では考えもつかなかったすごい時代ですね)

5

COMMENTkiyoka

mamorukさん、情報ありがとうございます。

今TokyoCabinetの仕様を見返したら、Sumibiのデータベースとしてすんなり使えそうな感じですね。

SumibiはMySQLを使っていますが、特にtableのJOINを多様しているわけではなくKey-Valueで十分だと思っています。

TokyoCabinetはIndex領域などの容量のオーバヘッドも少なそうなので、多分MySQLよりもメモリ使用量が減らせるかもしれませんね。

よく使うのだけメモリに置いてというのがうまくいけば2GByte程度のレンタルサーバとかでもそこそこ動かせるかも...

最近、レンタルサーバの値段が安くなって4GByteメモリが普通になるのを待つか、Sumibiを改造して少ないメモリでも動くようになるかを時々考えるのですが、考えているうちに4GByteのレンタルサーバが普通になってきそうで怖いです。

Sumibiを作った時は4GByteのサーバが必要というのは驚かれたものですが、最近ではあまり驚かれなくなってきました。

それにしても、SSDとかも出てきたりしてハードウェアの進化は早いですね。

統計的手法は数学の固まりだと思いきや、いざソフトウェアとして実装しようとすると、そんなハードウェアの進化を横目で見ながら手段を選択しているんだなとあらためて感じます。

0

comment (disabled)

5

5

 

5

 

5

kiyoka.2009_02_20[オープンソース] いつのまにか Debian 5.0 がリリースされていた

5
 Debian GNU/Linux 5.0 "Lenny" リリース!!!EXT
5
 以前のリリースから約2年近くを経て、Debian GNU/Linux 5.0 コードネーム
5
 “Lenny” が 2009/02/14、ついにリリースされました
5
 gnome
5

今 Debian GNU/Linux 4.0を使っているが、特に4.0に不満が無かったので気がついたら次の5.0がリリースされていたという感じ。

5

Windows XPユーザにも言えることだと思うが、どのOSもこれ以上のバージョンアップはあまり重要ではない気がしてきた。

5

ソフトウェア開発はWebアプリケーションにシフトしているし、OSやサーバマシンは自分で管理するよりは、Amazon EC2の様に誰かに管理してもらった方がラクだと思うようになってきた。

5

もし、Amazon EC2がもっと安くなったら契約しようと思っているのは自分だけではないと思う。

5

もっとも、Amazon EC2上で動かすOSは Debian GNU/Linux 5.0 "Lenny" を使うだろうけど。

5

それまでは差し迫ってバージョンを上げない可能性が高い。

5

 

1

COMMENTAlfredo

Your weibste has to be the electronic Swiss army knife for this topic.

0

comment (disabled)

5

5

 

5

 

5

kiyoka.2009_02_11[本][未来] 日本のIT業界の未来は暗い。ならば個人として準備できることは?

5
 4822215814  『IT産業 再生の針路』 破壊的イノベーションの時代へ
5
 4822215806  SIer,ITソフト会社のビジネスモデル再構築のための『IT一番戦略の実践と理論』
5

 

5

簡単に感想を書きたいと思う。

5

本を読まなくてもネットで前々から議論のまとになっているので、わかっている事ではあるが、明らかに日本のIT産業の未来は暗いという論調はどの本にも共通している。

5
IT産業の問題点を列挙すると...
5
建設業界のような多重請負構造
5
ユーザ企業がSIerに丸投げ(ユーザ企業にITの専門家がいない)
5
ユーザ企業がパッケージに業務フローを合わせることをしない
5
カスタマイズするほどSIerの売上が上がる構造
5
SIerの教育投資の問題
5
人月見積からくるSIerの低い利益率
5

どれも、聞いたことある話ばかりだ。

5

 

5

まあ、自分もこの業界に身を置いているので、何らかの準備をしないといけないなと思う次第。

5

今回の金融危機でユーザ企業はIT投資の予算が減る為、スタッフ部門が使うシステムなど、他社との差別化要因に成らない部分は真っ先にオーダーメイドはやめ、海外のパッケージ製品を使ったりSaaSの利用に流れたりするだろう。

5

要するに、何も特徴の無い業者は生き残れない可能性が高い。うわわわ。

5

 

5

さてどうすべきか。

5

この本も図書館で借りて読んだら、未来はどっちの方向に向かうのかを教えてくれた。

5
 4140812184  アルビン・トフラー―「生産消費者」の時代: アルビン トフラー
5

トフラーがいうのなら間違いないだろう。たぶん(^_^;)。

5

4062134527 富の未来でも書かれていたように、ネットの力により組織に対して個人の力が強まるだろう。

5

また、これまでただの消費者だったものが生産消費者となり、専門家に任せていたものを消費者が自分で生産(DIY)する傾向が強まるだろうということだ。

5

特に、デジタルの世界では自宅で自分の写真をプリントアウトしたり、自分でビデオ編集したりする傾向が強まる。

5

これは、個人だけでなく、企業や役所でも同じ。

5
 参考:見積もり2億円のIP電話を820万円で構築した秋田県大館市から学べること:ITproEXT
5

 

5

そんなわけで、IT業界がどうとか言う前に自分個人でできることは無いか考えはじめてみたり。

5

 

5

先日kiyoka.2009_02_08で書いた様に、『プログラミングなしでWebアプリを作るツール』のような方向が今後普及するんじゃないかと思って調査しはじめた。

5
 (参照:kiyoka.調査.簡易Webアプリ作成ツール)
5

一応自分の使ってみたい(かつ 作ってみたい)サービスのイメージはあるのだが、それに近いサービスは無さそうだ。

5

かなり未踏性が高いので未踏に応募しようかな。

5

まあ良いプロダクトは最初のアイデアが良いかではなく紆余曲折の末に良いものに持っていく実装能力と実行力の方が大事なので、未踏に応募した後が問題なんだけど。

5
 参考: simoom's nest:ベンチャービジネスのためのアイディア(Ideas for Startupsの翻訳)EXT
5
   本当のことを言えば、ほとんどの新興企業は初期のアイディアとは似ても似
5
 つかないことを結局行っているんだ。こんな風に言う方が真実に近いんじゃな
5
 いかと思う。つまり、初期のアイディアの主要な価値というのは、それがダメ
5
 になるのに気づく過程で、本当のアイディアを思いつくことにあるんだ、とい
5
 うように。
5

ダメかどうかをプロトタイプを作ってみる、という段階はやって損は無いかも。

5

 

0

comment (disabled)

5

5

 

5

 

5

kiyoka.2009_02_08[オープンソース] セルフパトロンシステムの限界

5

ノンプログラミングでWebアプリを作るシステムについて調べている。

5
 (参照:kiyoka.調査.簡易Webアプリ作成ツール)
5

その中でTuigwaaEXTというオープンソースプロジェクトを見つけた。

5

過去にIPAの未踏プロジェクトにも採択されており、可能性があるのかなと思ったのも束の間、TuigwaaEXTのサイトには開発終了宣言が出ていた。

5
 [2008/08/18] 重要なお知らせ
5
    WebUDA Tuigwaa プロジェクトは、新機能開発を停止することとなりました。
5

 

5

開発終了宣言をするオープンソースプロジェクトは珍しいので、もうちょっとだけ調べてみた。

5

結果、こんな記事に辿りついた。

5
 株式会社スターロジックの羽生章洋が書いてるブログ:ボランティア - livedoor Blog(ブログ)EXT
5
  実は今年の3月にTuigwaaの開発メンバーの皆さんが所属していた会社さんが
5
 なくなってしまいました。正確には関連会社さんに吸収されて事業の取捨選択
5
 がなされたということです。何はともあれ、一社に集まって会社の日常的な支
5
 援を受けて頑張っていたTuigwaaチームの皆さんは散り散りばらばらになって
5
 しまいました。今でも最小限のサポートなどは継続してくれていますが、それ
5
 ぞれが別に新しい道へと進み始めたところですから以前のようにパワフルには
5
 活動できません。まずは自分の人生を支えられるようになるところからだから
5
 です。
5
  OSSというのは一般的にはまだまだボランティア活動というのが大半です。
5
 Buriは会社の心臓部ですからBuriの開発者には相当量をBuriに割いてもOKとし
5
 ていますが、100%ではありません(というかBuriを中心にした周辺もやってい
5
 るので、Buriそのものだけに専念しているわけではありません)。ほとんどの
5
 方の場合、OSS活動というのはNightly Workと呼ばれる状態であるのはいかんと
5
 もしがたい事実です。
5

 

5

今後経済情勢が悪くなってくると組織として活動しているオープンソースプロジェクトでは同様の話がチラホラ出てくるんじゃないかと思う。

5

このあたりの話は、プライベートな時間を使ってオープンソースプロジェクトをいろいろやってきたので考えさせられる。

5

最近は子供が生まれたので、新しいことを思いついても構想はするけれどもさすがに手を付けることができなくなってきて、活動は停滞気味。

5

やっぱりプライベートな時間が有るか無いかは大きい。

5

昼間の仕事で生活基盤を作って、夜に自分で発案したプロジェクトに投資するという仕組みから来る限界か。

5

(そういえば、4062820927インフォコモンズ に『セルフパトロンシステム』といううまい言葉で表現されていた)

5

 

5

そんなこともあって、着手するプロジェクトはプロダクト自体が直接キャッシュを生む起業的なものを避け、自分のスキルアップに寄与したり、間接的に自分の今後に付加価値が付くようなものを指向することになる。

5

作る過程でSchemeのような高い抽象化能力が求められる言語を使えば、平均的なプログラミング言語では得られない高度な概念を扱えるようになる。

5

また、作ったものがプロダクトとして商品レベルになっていなくても、コンセプトが斬新だったり、多少なりとも世の中の為になるものであれば、勉強会なんかで名刺代わりになってくれ、自分を覚えてもらいやすい。

5

実際にSumibi.orgの例にとると、オープンソースコミュニティー方面では仮名漢字変換エンジンを開発されている方々から内容の濃いイベントに誘って頂けたり、海外の留学先から実際に利用して頂いている方々からは感謝のメールを沢山頂いたり、Web関連企業の方からはサーバを寄付して頂いたりSumibi Web APIを掲載いただいた書籍を献本頂いたりした。

5

 

5

しかし、そんな活動もプライベートな時間が確保できてこそ。

5

それは、セルフパトロンシステムの限界だと思う。

5

結論めいたことは書けないけど、短期的にはしんどいだろうけど、長期的に見ればセルフパトロンシステムは崩壊はしないと思うのでどういうプロジェクトをやるにしても、気長に続けるしか無いんじゃないかと思う。他人から決められた期限なんかないんだから。

5

 

4

COMMENTmogya

今日はどうもでしたー。古川です。

なんだかオープンソースやlinuxにコミットしている人が社内にいると聞いていたものの、あんまりそういう話をする機会なく会社を辞めちゃって、まさかこんな形で再開するとは思わなかったので、挙動不審だったら失礼しました。

セルフパトロン、興味深い話ですね。会社をやめて、自分プロジェクトにつっこめる時間は大幅に増えたのですが、思っていたほどアウトプットは増えなくて、なかなか難しいな、と感じています。

次に会った時はこういう話が出来るといいですね。

3

COMMENTkiyoka

昨日はどうもでした。

古川さんのような方が会社にいらっしゃったとは思いませんでした。

昨日はメインの話題が別のところにあったので、あまりお話できませんでしたが、次の機会にはいろいろお話聞かせてほしいです。

個人で仕事をされていて良い面、悪い面など詳しく知りたいです。

今後ともよろしくお願いします。

0

comment (disabled)

5

5

 

5

 

5

kiyoka.2009_02_06[プログラミング] コマンドラインを投稿するサイト Command-line FuEXT を発見

5

一行野郎を集めるサイト。

5

Redditみたいに投稿したコマンドラインをみんなで評価しあえるようだ。

5
 Command-line Fu < The best UNIX commands on the webEXT
5
 Command-Line-Fu is the place to record those command-line gems that
5
 you return to again and again.
5

 

5

私がよく使うコマンドライン(未投稿)

5
ファイルを検索してそれぞれのmd5ハッシュ値を求める
5
 find . -type f -exec md5sum {} ';'
5

 

5
ターミナルが文字化けするとき、英語メッセージに切りかえる
5
 unset LANG
5

 

5

私がよく使うコマンドライン(やっぱり投稿されていた)

5
.svn ディレクトリを検索して削除する
5
 find . -type d -name '.svn' -print0 | xargs -0 rm -rdf
5

 

5
grepがヒットするファイル名をリストアップ
5
 find /path/to/dir -type f -exec grep \-H "search term" {} \;
5

 

5

 

5

なるほどと思ったもの

5
直前のコマンドをsudoする
5
 sudo !!
5

 

5
2つのファイルをその場でソートしてdiffする
5
 diff <(sort file1) <(sort file2)
5

 

5
カレントディレクトリを変更せずに他の場所でコマンド実行する
5
 (cd /tmp && ls)
5

 

5
ランダムな文字列(非バイナリ)を表示する
5
tr -dc '[:print:]' < /dev/urandom
5

 

5

結局のところ、覚えやすい程度に短く、かつ強力なコマンドラインが実用的だと思う。

5

自分では思いつかなかったフレーズを仕入れるのにいいサイトだ。

5

早速このサイトをRSSリーダーに登録したよ。

5

 

5

COMMENTsion

find /path/to/dir -type f -exec grep \-H "search term" {} \;

は しょっちゅう使ってますね。

find は凝りだすとかなり色々できるから、スクリプト書けばいいのに

無理に find でがんばろうとしてしまったりする(笑)

5

COMMENTkiyoka

そうですね。

findは応用範囲が広いので下手に専用スクリプトをたくさん用意するより、

その場その場でfindプラス -exec オプションや xargs を組み合わせるほうが柔軟性が高い気がします。

スクリプトを準備していっても意外と帯に短し襷に長しで使えなかったりしますよね。

find と xargs の組み合わせは 関数型プログラミング言語でいうことろの高階関数(higher order function)だと思っています。

再利用性が非常に高い理由はそういうところかなと思います。

もっと凝った find コマンドが欲しいと思う時もありますが、それを作るのは暗黒面への入り口なのでやめています(笑)

0

comment (disabled)

5

5

 

5

 

5

kiyoka.2009_02_05[Life] 浅田真央EXTさんから電話がかかってきたり、はてなに転職したり

5

最近、フィギュアスケート選手の浅田真央EXTさんから、携帯に電話があって『次の4大陸フィギュア見にくるの?』だって。

5

『うん、いく予定』と答えておいた。

5

それから、はてなに転職したりもした。

5

 

5
 3629562_ab6b256746_m
5

 

5

どちらも夢だけど (笑)

5

 

5

浅田真央EXTさんからの電話の時、電話ごしに安藤美姫EXTさんが『間違って、ルッツジャンプ飛んじゃってぇ...』と喋っているのが聞こえた。

5

なんだこれ。

5

土曜日はTVでフィギュアスケート見るしかないね。

5

そんなに楽しみにしていたわけじゃないんだけどなぁ。

5

 

5

はてなのオフィスで働いている夢は二日連続で見たんだよね。

5

オフィスの中に階段があったり、よくわからんかったけど、みんな楽しそうに働いていた。

5

 

5

夢って面白いもんだよね。潜在意識に何が潜んでいるんだろう。

5

 

0

comment (disabled)

5

5

 

5

 

5

kiyoka.2009_02_02[本] 『クラウド化する世界』を読んだ

5
 4798116211 クラウド化する世界: ニコラス・G・カー, Nicholas Carr
5

最近のGoogleとかMicrosoftとかAmazonのクラウドの未来が知りたくて読んでみた。

5

実は、具体的なGoogle App EngineとかAmazon S3の話題に触れられているのかと思ったが、もっと全体の大きな流れを鋭く捕えていて良い意味で裏切られた。

5

(要約はkiyoka.一言要約に書いたので内容に興味がある人はそちらも見ておいてもらえれば嬉しい)

5

 

5

間違いなく未来はクラウドコンピューティングの方に行くことは間違いないと納得させてくれる本だ。

5

将来は自宅のパソコンだろうと企業の基幹システムだろうと自分でアプリケーションを入れて管理するのは少数派になっていくだろう。

5

現在NetBookとかミニノートが売れているのは、単に安価だからかも知れないが、今後はパソコンはセットアップがめんどくさいからイヤだというように、別の理由で敬遠される様になると思う。

5

企業内での増えつづけるサーバ管理についてもしかり。

5

そうなると、ソフトウェアの開発者もクラウド上で何をどう作るかというのを考え始めた方がいいと思う。

5

 

5

漠然とクラウドコンピューティングが流行りそうだから、ちょっと技術的なところを押さえておこうという人は並行してこの本も読んでおくといいでしょう。

5

長期的な視野とデータセンターが遠い国にあるということはどういうリスクが有るかというような、時間軸方向と空間軸方向の両面で広い視野で世界を俯瞰させてくれる。

5

でも、この点だけはちょっと納得いってない。本当にそんな事になるのかな。

5
 kiyokaによる要約。
5
 『ワールドワイドコンピュータにより知識労働が世界規模で取引される。その
5
 結果、経済の地域格差は小さくなるどころか、コンピュータ化により知識労働
5
 を自動化できる特に才能のある裕福な少数の人々と、それ以外の大多数の人々
5
 の間で格差が広がるだろう』
5

 

5

これからは、Amazon DynamoとかWindows SDSとかについて書かれた記事とかを読んでいく予定。

5

 

0

comment (disabled)

5