Drafts

@cm3 の草稿置場 / 少々Wikiっぽく使っているので中身は適宜追記修正されます。

BabelNet すごい

多言語対応が求められる場にいて最近Google翻訳にお世話になることが多い。最新版Google翻訳が好評: スマホがモバイル翻訳機になんてニュースも最近あったりして、翻訳研究は企業もがんばっている。

で、研究のプロトタイプサービスに組み込もうとすると、Google Translate API を使おうとすると有料だし、Bing Translator APIを使うことになるなぁと何となく思っている。

ところで、辞書的な言語資源が欲しいなと思った時に何を使うか。いつもDBpediaやWordNetを使うけれども、他に何があるか。うちのシステムは京大で開発されている言語グリッドを使わせてもらっているらしい。これもさっき初めて知った。 でその話の時に紹介されてたのがBabelNet

f:id:cm3ak:20150214103905p:plain

271言語!?!? この恐ろしいカバー率。元データはなんなんだろう。

f:id:cm3ak:20150214104830p:plain

そしてこれはhttp://babelnet.org/rdf/page/仏教_n_JAというページでちゃんとURIがdereferenceableになっている。SPARQL end-pointもある。Downloadもできる。すごすぎる。