読者です 読者をやめる 読者になる 読者になる

Drafts

@cm3 の草稿置場 / 少々Wikiっぽく使っているので中身は適宜追記修正されます。

morph.io

The Data Journalism Handbook の中に ScrapersWiki の話が何度も出てくるが、ScraperWikiのトップからはどこにそのような機能があるかわからず、調べてみたらScraperWiki Classic のエントリー例のように旧版の方に情報が read-only で残されていて、ScraperWiki Classic retirement guide | ScraperWikiにあるようにmorph.io に移行しているようだ。こちらはプログラムが github 上に置かれるようになっていて、そもそもアカウントが github アカウントになっているなど、github との連携が進んでいる。

例えば morph.io: jkonowitch/imdb-top-250 みたいなスクリプトが旧 ScrapersWiki から移行されて使えるようになっている。

似たようなサービスにScrape.itImport.ioというのもあるらしい。

注意しなければならないのはDocumentationに書かれているように、スクレイプの合法性の担保はユーザの責任だということだ(当然)。基本的に自分がやっていることの手離れが悪いので、こういうサービス上に公開することでとっとと離してしまいたい。

参考: