kiyoka.2007_03_17 RSSPLAIN

Related pages: !kiyoka.blog.list !kiyoka.blog.2007_03
555555555555555
5

[Sumibi] Googleが大規模日本語データを公開するかも

5

スラドの記事EXTで知りました。

5

Yahoo!EXTに続いてGoogleも大規模日本語データを公開するかもしれません。

5

GoogleのリンクはこちらEXT

5

大規模データが公開されれば、SumibiEXTの実験に利用してみたいと思います。

5

商用利用ができないということになれば、一般に公開しているSumibi.orgでは使えないということに成るかもしれませんが、動きを注視したいと思います。

5

ところで、Sumibi以外の人達はどんなデータフォーマットが欲しいんだろう。

5

Sumibiとしては、きちんと分かち書きされた日本語データが欲しいです。それ以外の要件は特にありません。

5

 

5

 

5

COMMENTusata

ある程度話は聞いて知っているのですが、3月20日のセッション聞いて

書いてもいいところは自分の Web 日記に書きます :-)

英語版は Google n-gram というのが既に出ているのですが、

日本語に関してはリソース出していないんですよね。

5

COMMENTkiyoka

usataさん、情報ありがとうございます。

またWeb日記読みに行きます。というかマイミクでしたね。^_^

Googleのセッション参加されるんですね。

東京アンド平日のダブルパンチで行けません。

うらやましいです。

5

COMMENTohura

実は、私、当日の昼間(もう明日ですが。)、同じ会場で本業の研究発表をします。Google のセッションも聞いてこようと思っています。時間が短いのでどれだけの内容があるのか分かりませんが。

5

COMMENTkiyoka

ohuraさん、コメントありがとうございます。

本業で自然言語処理を研究されているんでしょうか。

本業でできるというのはうらやましいです。御苦労も多いでしょうけど。

今度お会いすることがあったら、お話を聞かせてください。

5

...comment disabled...