Drafts

@cm3 の草稿置場 / 少々Wikiっぽく使っているので中身は適宜追記修正されます。

データの公開と活用

データ

イベント

自分が参加できていないものも多く含む。メタには「人文情報学月報」のイベントカレンダーなどは重要なソース。

2015/12

出れなかった…が知人が主催者だったので、後程、資料を得、話を聞いた。

Archiving of Asia in Asia の Lecture Note メモ

コルコタの Bhaktivedanta Research Centre (BRC) が貴重書やヒンドゥーをはじめとするインド宗教本のデジタルアーカイブをした際の取り組みについて。

ニュージーランド図書館の開発したオープンソースKoha Integrated Library System (Koha ILS) を用いた。このシステムは、Dublin Core を中心とする DSpace と比して MARC を中心としている。MARC は古くから使われており、語彙が多い(Dublin Core の語彙を 15 とカウントしていたのは拡張語彙は入れずだと思う。もしくは DSpace のデフォ設定か)

アーカイブ作成手順:

  • BookEye scanner で TIFF もしくは デジタルカメラJPEG を撮る
  • 文書スキャンの標準的な後処理で綺麗にし、歪みを除去
  • PDF に「縫い付け」る

(個人メモ:スキャンネタは デジカメでの図書館資料撮影のノウハウとデータの共有は可能か - Drafts でも考えてたな。)

(p.2 末尾 In terms of 以降未読)

2016/1

2016/2

記事、特集号など

  • [DHM053]人文情報学月報【前編】◇《連載》「Digital Japanese Studies寸見」第9回 「「国文研古典籍データセット(第0.1版)」公開」(岡田一祐:東京外国語大学アジア・アフリカ言語文化研究所)→人文情報学月報 / Digital Humanities Monthly後程ウェブ公開されればリンク貼り直しますが、いまはMLでしか見れないです。
  • 計量国語学会「WWW コーパスを用いた研究」(2016年9月下旬  第30巻6号に掲載予定)
    • あんまり関係ないかもしれない。コーパスを用いた研究はデータの活用だし、WWWなので公開されているのが前提だと思うけれど。ふたを開けてみてまた纏めたりします。
  • open-access に関する cm3ak のはてなブックマーク データと論文では違うけれど一応参考までに論文の「オープン」について。