Drafts

@cm3 の草稿置場 / 少々Wikiっぽく使っているので中身は適宜追記修正されます。

2015-06-03から1日間の記事一覧

Solr で複数のデータを投入する

jsonでの場合、update request-handler に、 [ { "id": "1", "title": "Mercury", "composition": ["sodium","hydrogen","helium","potassium"] } { "id": "2", "title": "Venus", "composition": ["carbon dioxide","nitrogen"] } ] のように複数のドキュメ…

Solr でタグのようなデータ構造を用いる

JSON の場合、 { "id": "1", "title": "Mercury", "composition": ["sodium","hydrogen","helium","potassium"] } のようにリスト構造を使うことで、複数の値が可能になった。 f.<fieldname>.split=true&f.<fieldname>.separator=<separator> というのを使うと、CSVでも同じことができるようだ</separator></fieldname></fieldname>…

Solr5 で 日本語 を扱う

3つの選択肢があるようだ、kuromoji を使ってみようと思う。具体的な使い方は後程追記。 CJKAnalyzer で bigram モデル。一文字のクエリが扱えない。未知語に強い。速い。 JapaneseAnalyzer で lucene-gosen を使う。形態素解析するので bigram と逆の特徴。…