kiyoka.2013_03_23 RSSPLAIN

Related pages: !kiyoka.blog.list !kiyoka.blog.2013_03
5555555555555555555555
5

[Sekka][辞書] 平仮名フレーズ辞書の入れかえ成功

5

 

5

Wikipedia日本語版のテキストデータを使って平仮名フレーズを作った。

5

これまで使っていた日本語ウェブコーパス 2010EXTは廃止した。

5

 

5

結果、先日のエントリ「kiyoka.2013_03_16[Sekka][辞書] 平仮名フレーズ辞書を入れかえたい」で書いたように口語体の表現が少なくなり、固めの文章が書きやすくなった。

5

さらに、もう一つメリットがあって、辞書のライセンスがわかりやすくなった。

5

WikipediaはGFDLなので、はれてSekkaの辞書は全て次のオープンな素材から生成された辞書となった。

5

 

5
平仮名フレーズ1 = Wikipedia
5

GPDL。

5

 

5
平仮名フレーズ2 = IPADic 
5

BSDライセンスに近い? 但しDeibanでは non-freeに分類されているらしい。

5

 

5
日本語と片仮名  = SKKの辞書
5

GPL2。

5

 

5

というわけで、前よりもDebianなどのディストリビューションに入れやすいものになった。

5

一週間くらい使ってみて、Sekka 1.3.0と一緒に公開する予定。

5

 

5

...comment disabled...