Drafts

@cm3 の草稿置場 / 少々Wikiっぽく使っているので中身は適宜追記修正されます。

「地獄」を記述してみる

ビルマ仏教の輪廻説という論文の中に

f:id:cm3ak:20160228174957p:plain

のような厨二病心擽る知識(とはいってもまあ日本でも一般人が言葉くらいは知っている初歩的なもの)が記述されていたりする。この論文自身は、ビルマの文化の根底にある上座部仏教の中でも、教育階層を問わず彼らの日常の世界観に影響していると考えられる輪廻転生の仏教的世界観を記述したものである。だから、この世界構造を頭に入れることに特に直接的に意義はなくて(当然)、それが縁起概念とどうつながっているかといったことが研究としての意義となっているのだが、その「点」の読み解きを、時間の変化や、地域差といった「線」や「面」に広げるにあたって、多くの上座部仏教に共通する部分とビルマ仏教独自の部分などが即座に比較できることには意義があると考えられる。

Wikipediaと、The Thirty-one Planes of Existence台湾の研究グループの資料、たぶんSAT大蔵経にも、似たような体系の記述があるが、ボトムアップに個々を知識化してつないでいくというアプローチを採用した際に、この知識は例えばどう書いておくのが再利用性高いと見込まれるだろうか。また、作成者が楽だろうか。


(中略)


JSON-LDで生で書いてみることにした。

初版

f:id:cm3ak:20160228180602p:plain

改訂版

f:id:cm3ak:20160228185410p:plain

改訂版ソース

{
    "@context": {
        "buddhism": "http://xinchao.cias.kyoto-u.ac.jp/projects/buddhism/",
        "skos": "http://www.w3.org/2004/02/skos/core#",
        "rdfs": "http://www.w3.org/2000/01/rdf-schema#",
        "prov": "https://www.w3.org/TR/prov-o/"
    },
    "@id": "buddhism:a-1",
    "@graph": [
        {
            "@id": "buddhism:a-1#this",
            "@type": "skos:Concept",
            "rdfs:label":[
                {"@value": "地獄","@language": "ja"},
                {"@value": "Niraya","@language": "pi"}
            ],
            "skos:broader": "buddhism:a"
        },
        {
            "@id": "buddhism:a-1",
            "prov:wasDerivedFrom": "http://hdl.handle.net/2433/54840"
        }
    ]
}

多言語のラベルの記述

Lemon - Lexicon Model for Ontologiesのような本格的な言語モデルを使ってもよいのだが、今回は特に変化形などを書くことはしないので、JSON-LD 1.0 #string-internationalizationに書いてある程度の基本的な書き方をすることにした。

複数言語があるときには、

"rdfs:label": {
 "ja": "地獄",
 "pi": "Niraya"
},

のような書き方とかが指示されているが。rdfs:label の場合は

"rdfs:label": [
 {"@value": "地獄","@language": "ja"},
 {"@value": "Niraya","@language": "pi"}
]

のような書き方のほうが Semantics はハッキリする気がする。@value@language については記述があるが、複数の場合にリストに入れてよいのかはあとで確認が必要。

ちなみに、付記されている原語は上座部仏教でよく使われるパーリ語だと思ってISO 639-1でpiアノテーションしている。

階層関係

skos:broaderを使って書く。skos:broader は isPartOf なのか is-a なのかセマンティクスがはっきりしないことになっている。これは今回のように外在する実体を指しているか概念的なものかはっきりしないような知識には打ってつけだけれども、推論ができないという弱点がある。

つまり、「自転車」の下位概念の「マウンテンバイク」は乗り物として使うことができるが、「自転車」の一部である「サドル」を乗り物として使うことはできない。こういう区別を行うことができないので、推論の詳しい部分はアプリケーション任せになってしまうという弱点があるということだ。

来歴

JSON-LD 1.0#named-graphs に Named Graph の書き方は書いてあるが、来歴をどうやって書いたらいいかまでは書いていない。上の初版は基本的に誤りであり(来歴は bg:a-1 の方に別のIDもしくはデフォルトグラフの下に書かれるべき)、一ファイルに書ききるという利便性の面からも、改訂版の書き方がよいと思われる。

その他参考