もう確認した?PyCon JP 2015、公開済み全スライドまとめ #pyconjpをざざっと見て、興味あるところだけまとめておく。slideshareでついでに飛んだのも含まれてる。
- ドキュメント翻訳面倒じゃない?pot から po 作るとこだけやってもらってあとは sphinx がやってくれるのすばらしいよねという話。→ CR05 Sphinxで作る貢献しやすいドキュメント翻訳の仕組み - YouTube
- やっぱ TeX ってオワコンね。軽量マークアップが html化 や pdf化で TeX 依存する必然性はないので、今後はその方向性になるんじゃないかな。→ TeXはオワコンなのか?(TeXユーザーの集い2014) princexml よさそうだけど確かに高いよね。css 組版の環境を整えていこうという主張なのかな。後述の markdown の方言が多いことは、それぞれの目的(辞書、論文、写真集等)に従って、markdown variant がユーザにとって書きやすいものになる可能性と考えると、よいことかもしれない。ScholarlyMarkdown とかもそういう経緯で作られている。
- Markdown 方言大杉。Pandoc がいろいろ解釈してくれたり便利だよ。CommonMark って標準化の動きもある。→ Markdownもはじめよう
- Pandoc の中では 抽象構文木(abstract syntax tree、AST)に変換するフェーズがあってそこのフォーマットが JSON なので json2json の変換器を書けば独自フィルターが作れる。→PythonでPandocのフィルターを書く - Qiita
Pandas 熱い
MH02 Python と型ヒント (Type Hints) - YouTube Python で型付けしたいって思ったことが無いけど、新鮮な話題だったので面白かった。
エクセルのファイルが分けられていたり、項目変更があったりして、e-statのデータは現実的に時系列分析ができない。(e-stat の API が RDB のダンプなのは逆に RDB 再構成できるんならいいんじゃないかとは思うけど)日本の経済・社会統計が使いにく過ぎるという主張はほんまそのとおり。で、スクレイピングからデータ保持からサービス運営まで Python でやってますという紹介。ここでも Pandas 出てきたよ。→ CH04 日本のオープンデータプラットフォームをPythonでつくる - YouTube
- 統計八百屋「とどラン」|新・都道府県別統計とランキングで見る県民性 日本人は県民性みたいな話好きで、これはアメリカの州とかフランスやイタリアの南北とか、似たような Narrower nationalism (俺の造語、なんかちゃんとした専門用語あったら教えて)はよくあるんだけど、そういうまとめ方にも e-stat の分け方は向いていない。そこでこのサイトの運営者はうまく料理してポータル化している。