Drafts

@cm3 の草稿置場 / 少々Wikiっぽく使っているので中身は適宜追記修正されます。

2015-06-01から1ヶ月間の記事一覧

「世の中には2つのタイプの人間がいる。」

アメリカ最高裁が同性婚を認める その命令文が美しいと話題になった件で共感していたツイートをメモがてら貼っておく。冒頭2つが最もグっときてファボってたツイート。 一方で全部が全部俺と一緒の立場というわけでも無くて、「婚姻制度自体いるかというと…

WebGLのテクスチャ

WebGL で海月を描いているデモがめっちゃ綺麗 → Chrysaora - WebGL 作者は Google Creative Lab で働いている Aleksandar Rodić さんで、portofolio にこの海月の話も説明されている。専用の 3D グラフィックエディターで作ったものを WebGL 用に吐き出して…

fossil や git での ドキュメントは wiki を下書きにした方がイイ

git は fossil と違って Wiki が無いが、結局他人と共有するときは GitHub があるので Wiki を使うことができる。 GitHubのトップページは readme.md で固定だし、fossil で wiki に画像を追加する - Draftsに紹介したような方法で fossil のトップページも …

根性論再訪

スタンフォードの自分を変える教室に意志力は筋力みたいに疲れたり鍛えられたりするものだという話が出てくる。研究や芸術的創造活動に向かう力も意志力が時に必要で、それは筋力みたいなもので、根性が必要だと最近つくづく思う。 漫画の話で、東村アキコ『…

一党優位政党制という問題

「経団連に働きかけ、マスコミ懲らしめを」 自民勉強会:朝日新聞デジタルは本当に酷い話だと思うが、一方で、政党が自分に有利なように事を進めるのは当然だ。こういう意図を持っていることが表に漏れてしまうのは自民党が馬鹿だから&メディアが狡いからと…

語用を記述する

基本的に、語用を記述するといったら、対象の語を実際に使っている文を例示することを指すだろう。コンピュータ処理する場合も、それだけの情報からセマンティックスを取り出す技術も十分発展している。最近はやりのディープラーニングとかね。 でも、人間が…

実家の隣町のアパートに住むということ

仕事をするにあたって実家に住むかどうかというのは難しい。 うちの実家は亀岡で、生まれたころは汽車が電化さえされていなかった。1990年3月に電化完了、2010年3月に複線化完了ということでそれまで京都へでるの自体がすごく時間がかかっていた*1。今は実家…

Annotated Bibliography について

Annotated Bibliography とは あるトピックを理解するのに重要な本や論文を、要約や評価の注釈と共にリスティングしたものである。サーベイなどに使われる。 一般的な内容は 要約 目的、議論、手法、実験結果など。 一般的評価 理論的基盤、信頼性、他の論文…

Referring expression とは

日本語に訳すなら「参照表現」か。例えば、固有名詞(Proper noun)である London や、英語でいう定冠詞付の名詞である the apple みたいなのは現実世界のあるものを指している。ウェブの世界ではウェブのドキュメントが参照先で無い限り実世界の参照先を直…

Musescore でリピートなどを跨ぐタイは未実装

こういうやつね。バージョン 2.01 でまだ未実装だけど、実装のプライオリティは高いとのことです。 今はマニュアルで入れていますが、少しカッコが悪いです。 参考: Tie a note at an "end repeat" | MuseScore

名前ベースのLODの利点

Wikipedia を元にした DBpedia とかは、Wikipedia と同様 URI にその項目の名前が埋め込まれている(例: http://ja.dbpedia.org/page/京都府。もちろんURIを手掛かりにできるというのも利点になり得るが、それは URI に余計な意味を持たせないという原則*1か…

外部のデータの一歩先まで書くというプラクティス

LOD

Web of Dataの実装である Linked Data における「対象となる事物をURIで指す」ということは、たびたび反発を受けてきた。代表的なのは、リンク切れを起こすでしょ、という反発。「京都府」と記しておけばいいのに、「http://lod.ac/id/305106」と記してしま…

生物名を基盤にした LOD が増えてきている

論文で「国内外にLinking Open Data cloud に載ってるレベルで LOD 対応した 同様の生物名データベースは存在しない!」みたいな主張を続けてたが、まあ大事なものほどすぐに追従されるわけで。 LODACBDLSと書かれているのがLOD.AC BDLS(現 LOD.AC Species…

ここ一カ月の仕事スタイルの反省

他にも反省すべき点あるけれど、8月まではプライベートとかは完全に捨てなきゃいけない状況で、その状況の改善などは後回し。 体力は確実に落ちている 一つは自分の体力の変化について。数年前まで、一日仕事して、飲み会して、徹夜でスポーツして、朝2時…

Chrome のウィンドウが閉じるのを防ぐ方法募集中

ウィンドウの左上の端っこをダブルクリックすると、ウィンドウを閉じられるのは Chrome に限らず Windows アプリの共通仕様らしく、なんどもそれで泣きを見ている。Window Close Protector - Chrome ウェブストア というドンピシャのは最新版では使えず、Kee…

Markdown で生の html の処理がおかしいかも

fossil scm で twitter を embed しようとして、アンダースコア _ を含むユーザ名の人を貼り付けたら、その部分が<em>扱いされてコードが壊れた。htmlタグ内は Markdown 記法機能しないのが正しいんじゃないかしら。</em>

NLPのライブラリ、プラットフォーム

Pythonista にはNatural Language Toolkit (NLTK)が定番だろう。 Apache UIMA(UIMA は Unstructured Information Management Architecture の略らしい)はフレームワークとして提供されていて、DKPro CoreやU-Compareといった形でそれぞれの目的に特化したU…

Solr で複数のデータを投入する

jsonでの場合、update request-handler に、 [ { "id": "1", "title": "Mercury", "composition": ["sodium","hydrogen","helium","potassium"] } { "id": "2", "title": "Venus", "composition": ["carbon dioxide","nitrogen"] } ] のように複数のドキュメ…

Solr でタグのようなデータ構造を用いる

JSON の場合、 { "id": "1", "title": "Mercury", "composition": ["sodium","hydrogen","helium","potassium"] } のようにリスト構造を使うことで、複数の値が可能になった。 f.<fieldname>.split=true&f.<fieldname>.separator=<separator> というのを使うと、CSVでも同じことができるようだ</separator></fieldname></fieldname>…

Solr5 で 日本語 を扱う

3つの選択肢があるようだ、kuromoji を使ってみようと思う。具体的な使い方は後程追記。 CJKAnalyzer で bigram モデル。一文字のクエリが扱えない。未知語に強い。速い。 JapaneseAnalyzer で lucene-gosen を使う。形態素解析するので bigram と逆の特徴。…

Linked Data で URI に 番号を用いるときは zero fill すべきか否か

結論 否。 理由 zero fill はそもそもなんのためにあるのだろう。 桁数をそろえたい データベースなどで確保する記憶領域を最適化するために桁数をそろえたい 数字のみを切り出す処理を簡略にするために桁数をそろえたい(a[-4:]みたいな形で末尾4ケタを取っ…