kiyoka.2011_11_05 RSSPLAIN

Related pages: !kiyoka.blog.list kiyoka.2012_01_03 !kiyoka.blog.2012_01 !kiyoka.blog.2011_11
5555555555555555555555555555555555555555555555555555555545
5

[MongoDB] MongoDB試用開始

5

MongoDBEXTをさわりはじめた。versionは現時点の最新の version 2.0.1 。

5

1449381561 私が参照している本。

5

メモリがいくらあっても足りない。4GByte RAMのサーバマシンで3.8GByteまで使っている。

5

もちろん他にもいろいろ走っているので、2GByteほどswapしている。

5

 

5

まず、1GByte程度のapacheログをmongoimportできるJSON形式にしてimportした。

5

mongoimport用の変換内容は時刻部分をDate型に、転送サイズを数値型に変換した。それ以外は文字列のまま。

5

mongoimportで投入し、リクエスト時刻フィールドにIndexを張ったらDBサイズが5GByteになった。

5

うげー、でかいよ。

5

 

5

その後、リクエスト時刻部分から時分秒を00:00:00に切り落としたDate型をもうひとつ追加したら、DBサイズがまた肥大した。

5

DISKもよく食う。

5

 

5

結局次のようなドキュメントの構造になった。

5

Indexはtimestampとurlに張って、14GByteのDBサイズに!

5

 

5
 $ mongo --host black sumibi
5
MongoDB shell version: 2.0.1
5
connecting to: black:27017/sumibi
5
> db.apachelog.findOne()
5
{
5
        "_id" : ObjectId("4eaf66c734168d18eb210c4e"),
5
        "client_id" : "-",
5
        "hostname" : "111.111.111.111",
5
        "referer" : "-",
5
        "req" : {
5
                "method" : "GET",
5
                "url" : "/sumibi/Sumibi_stable.wsdl"
5
        },
5
        "request" : "GET /sumibi/Sumibi_stable.wsdl HTTP/1.0",
5
        "result_code" : "200",
5
        "tfrsize" : 6940,
5
        "timestamp" : ISODate("2011-10-08T21:56:22Z"),
5
        "timestampDaily" : ISODate("2011-10-08T15:00:00Z"),
5
        "user_agent" : "-",
5
        "username" : "-"
5
}
5
> db.apachelog.count();
5
6072350
5
 ※ hostname部分はblog用にマスクしてあります。
5

 

5

それにしてもMongoDBのshellがJavaScriptなのが便利だなーと思ったのも束の間、すぐにJavaScriptの非力さが気になりはじめた。

5

Prototypejsを使いたくなるほどのプレーンさだ。でも、mongo shellには載らないだろうな。うーん。なんとかならんかな。

5

 

5

久々にこんなプレーンなfor文を書いたよ。半年ぶりくらいかなー。

5
 for ( i = 0 ; i < a.length ; i++ ) {
5
 ...
5
}
5

 

5

Prototypejsを使えば、mapやeachなんかを使って書くのでループ変数を使ったコーディングは懐しささえ感じる。

5

まだ使い始めたばかりなので、癖はわからないが、いろいろ負荷の高い処理をやらせたりMapReduceをやったりして数日使ってみようと思う。

5

 

5

※ ちなみに個人的な学習用リポジトリはkiyoka/learn-mongodb - GitHubEXTで公開しているので、クエリのサンプルとか見れますよ。

5

 

5

 

4

COMMENTkiyoka

自分でコメントします。

なんかメモリが足りないという発想がMongoDBに合っていない気がする。

データベースのサイズに対してメモリが足りないのであればマシンを増やして分散するのが筋かなー。

もうちょっと実験が進んだら、AWSの時間貸しインスタンスを借りるのがいいのかな。

5

...comment disabled...