@johtaniの日記 2nd

@johtani ‘s blog 2nd edition

第14回Elasticsearch勉強会を開催しました。 #elasticsearchjp

あけましておめでとうございます、johtaniです。

第14回Elasticsearch勉強会を開催しました。 スタッフの皆さん、スピーカーの皆さん、会場提供していただいたリクルートテクノロジーズさん、ありがとうございました! 今年もよろしくお願いします!参加していただき盛り上げていただいた参加者の皆さんもありがとうございました。

チェックイン数など

  • チェックインした人:122名
  • キャンセルしなかった人:58名

でした。 今回も当日の昼の時点でキャンセル待ちがない状態にしていました。 いくつか電車が止まっていたという話を聞いていたので、開始を5分遅らせ、 受付は45分くらいまで開けておくという対応をしてもらいました。

“ココが辛いよelasticsearch” / 株式会社リクルートテクノロジー @tatakaba さん

スライド:ココが辛いよelasticsearch

実際にいくつかのサービスで運用されている内容とどういった機能を利用しているか、 どういったものを独自に作っているかという話をしていただきました。

  • 独自PluginでA/Bテストしてる
  • Snapshotの活用
  • Index作成は環境に合わせて行っている。
  • バージョンは混在
  • PusnaRSのバージョンアップの話。
    • 2つのバージョンのクラスタを用意してリアルタイムに切り替え。
  • Elasticsearchの活用
    • QueryのRewrite:
    • SolrのリクエストをEsで受け付けたり。
  • 辛い話。
    • バージョンアップが辛い
    • Riverなくなるのつらい
    • データずれるのつらい

補足:

バージョンアップについて

1.x系から2.x系にアップされるのであれば、こちらを必ず試してください。

https://github.com/elastic/elasticsearch-migration

「.」が使えなくなるという話は、Solrとの大きな違いになるのかもなぁと。 ネスト構造のデータの表記を「.」で行うというのを厳密に行えるように、 「.」を使えなくしたというのがあるかと。

Riverについて

Riverがなくなった理由については、https://www.elastic.co/blog/deprecating-rivers で記載があります。 便利なのですが、負荷が偏ったり、スケールしないとかいう問題点があるかなと。

良いサンプルとしては、JDBC Riverなどは、Javaのプログラムとして起動できるように変更されていたりします。

https://github.com/jprante/elasticsearch-jdbc/wiki/jdbc-plugin-feeder-mode-as-an-alternative-to-the-deprecated-elasticsearch-river-api

個人的 には、SolrのDIHもRiverもあんまり好きではなかったです。データの変換処理と、ロード処理は別々にしたい人だったので。)

データのズレなど

耐障害性とか信頼性に関しては、どういった問題点があるのか、どういった対応をしているのかというのがまとめられたページが用意されています。

https://www.elastic.co/guide/en/elasticsearch/resiliency/current/index.html

「機械学習を利用したちょっとリッチな検索」 / Preferred Networks America, Inc. CTO 久保田展行(Kubota Nobuyuki) さん

スライド:機械学習を利用したちょっとリッチな検索

来日していただき、機械学習と検索の話をしてもらいました。 本編は次回の発表かもw

  • 機械学習を元に、検索対象の情報を元の情報から増やしてあげる。
  • 増えた情報を検索できるようにする

今日のゴール:

  • 機械学習とはどういうものか?
  • データの集め方とか、アノテーションとか
  • 学習の方法(ツールやライブラリに依存)

Esでの活用方法

  • オフラインで学習させて、情報を付与した後に、Elasticsearchに入れる
  • Jubatus+fluentdで
  • ChainerサポートのOSSのツールを公開予定

「ここからが本当の地獄だ。。。」ってのが聴きたいw

「Lucene Query 再考 - Domain Specific Query 実装 -」 / Supership株式会社 インフラ事業開発本部検索グループ 大川真吾 さん

スライド:Lucene Query 再考 - Domain Specific Query 実装 -

Luceneのクエリに関する話と、クエリパーサーに関する話でした。 こういった濃い話も勉強会でしてもらえると、色々な参加者に楽しんでいただけるかなぁと。 次回も続きを話してもらう予定です。

補足:

参考までにですが、Elasticsearchに入門したての人向けに、 Analyzerとか転置インデックスとかの話をした時のスライドになります。 https://speakerdeck.com/johtani/lucenetori-ben-yu-falsejian-suo

LT:

Fluentd meets Beats / @repeatedly さん

スライド:http://www.slideshare.net/repeatedly/fluentpluginbeats-at-elasticsearch-meetup-14

参考Qiita:http://qiita.com/repeatedly/items/77af41788f0b3ccdefd2

Beatsの説明をTDの人からしてもらうなどw FluentdにBeatsからのデータを流し込めるようにしたプラグインが出たという話でした。

filebeatの性能の件は社内で聞いてみようかと。

Elasticsearchインデクシングのパフォーマンスを測ってみた / 日本IBM 黒澤亮二さん

スライド:Elasticsearchインデクシングのパフォーマンスを測ってみた

参考Qiita:http://qiita.com/rjkuro/items/e79eec7ffb0511b7c678

細かな性能測定の結果を駆け足で話してもらいました。 皆さんもこの指標をもとに、手元の環境を計測してみたりしてみてもらえればと。

あとは、2.x系になってるので、同じ方法で計測してもらってまた 発表してもらえると嬉しいなー(棒)

その他、感想などのブログ

まとめ+宣伝

久々に(初めてかな?)、ゲストがいないのに自分が喋りませんでした。 次回は3月中旬を予定してます。 次回は、Elastic{ON}16の報告をする予定です。いろいろと発表あるだろうし。

あと、今月末の1/29にオープンソースカンファレンス [email protected]にブース出展します。 セミナー枠でも弊社OSSプロダクトの概要を話しする予定です。 関西の方は、ぜひ参加していただければと。ブースでお待ちしております。

また、スピーカーや場所が用意できたら、出張勉強会もまたやりたいなと思っています。 興味ある方は、連絡ください!

Comments