STFCのページから元のdraftはダウンロードできる。
1. Discoverable
データを発見可能にすること。以下のような方策が例示されている。
2. Accessible
できるかぎり利用に制限のない形でデータを公開しよう。ただし、研究活動が阻害されないように、利用規約の同意、商用利用の禁止など様々な制約を設けることは可能である。また、データを活用した側は必ず出典を表示しなければならない。
3. Understandable
数字だけでなく、文書やビデオでさえも、追加の文脈、セマンティクス、データ分析ツール、アルゴリズムなしには理解できないと心得よ。例えばセンサデータは、場所、時間、計測方法などの文脈が必要だ。言語的には、英語が研究世界のデファクトになっているので、英語で説明を付すことは必須だ。
4. Manageable
データ管理のポリシーを用意したり、責任を明確にしたり、そういう努力なしには実現できませんよ。
5. People
複雑なデータセットや様々なプロトコルに精通した専門的なデータ管理人(custodian)が必要で、その育成も必要だ。また、各研究者にもデータ管理に関する素養が必要だ。
まあ、あまり洗練された原則じゃないな。2については事例を収集しなければ、どういうときにどういう制限をつけれいいかわからず、際限なくキツい制限になるだろう。3については文脈をどのように書くことが Understandable にするのか記述が無い。で、4, 5 みたいなメタな部分に押しつけている印象。
その他参考
- https://japanlinkcenter.org/top/doc/150227_7_murayama.pdf データサイテーションについてdoiを紹介
- https://www.coar-repositories.org/files/4_COAR_SPARC_ConfJSiren.pdf 上の原則を紹介
- www8.cao.go.jp/cstp/sonota/openscience/6kai/6_openscience_siryou_1_2.pdf上程度のまとめなら実は、国際的動向を踏まえたオープンサイエンスに関する検討会(第6回)議事次第 - 総合科学技術・イノベーション会議 - 内閣府の資料2にあった。www8.cao.go.jp/cstp/sonota/openscience/6kai/6_openscience_siryou_1_5.pdf 資料5の「8. 用語の説明」とかなかなか役に立つ。エンバーゴってそういうことか。