Drafts

@cm3 の草稿置場 / 少々Wikiっぽく使っているので中身は適宜追記修正されます。

オープンデータ基盤の5原則

STFCのページから元のdraftはダウンロードできる。


1. Discoverable

データを発見可能にすること。以下のような方策が例示されている。

2. Accessible

できるかぎり利用に制限のない形でデータを公開しよう。ただし、研究活動が阻害されないように、利用規約の同意、商用利用の禁止など様々な制約を設けることは可能である。また、データを活用した側は必ず出典を表示しなければならない。

3. Understandable

数字だけでなく、文書やビデオでさえも、追加の文脈、セマンティクス、データ分析ツールアルゴリズムなしには理解できないと心得よ。例えばセンサデータは、場所、時間、計測方法などの文脈が必要だ。言語的には、英語が研究世界のデファクトになっているので、英語で説明を付すことは必須だ。

4. Manageable

データ管理のポリシーを用意したり、責任を明確にしたり、そういう努力なしには実現できませんよ。

5. People

複雑なデータセットや様々なプロトコルに精通した専門的なデータ管理人(custodian)が必要で、その育成も必要だ。また、各研究者にもデータ管理に関する素養が必要だ。


まあ、あまり洗練された原則じゃないな。2については事例を収集しなければ、どういうときにどういう制限をつけれいいかわからず、際限なくキツい制限になるだろう。3については文脈をどのように書くことが Understandable にするのか記述が無い。で、4, 5 みたいなメタな部分に押しつけている印象。

その他参考