目次
ということで、いつものように勉強会に参加したメモです。
http://atnd.org/events/23608 日時 :2012/01/26 19:00 to 22:00 会場 :アカデミーヒルズ(六本木ヒルズ内) 49階(タワーホールA) (港区六本木6-10-1) ハッシュタグ :#mnlgy
■タイムテーブル
司会:CROOZLabs株式会社 研究所 所長 代表取締役社長 小俣 泰明
モーションノロジーの説明があったけど、他のことしてました。すんません。
1.
発表者: 有限会社未来検索ブラジル 森 大二郎
概要:groongaの索引構築の実装
全文検索とは。歴史から
1971:full-text。。。というキーワードが。
現代の全文検索の課題はあんまり変わってない
全文検索の手法
いくつかあるけど、転置索引の説明だけ。groongaも転置索引
groongaはインデックスの動的構築が得意
静的構築も考慮してます。
2.
発表者:CROOZ株式会社 長谷川 博紀
概要:MeCabからの脱出?(仮
CROOZ MALLの解説
MySQLとMeCabでやってます。
Tritonnつかってるのか?
groongaとの性能比較検証やってみました。
MeCabが問題じゃなくて、辞書ありの形態素解析が問題。
辞書にない単語もうまく検索したい
辞書に単語登録したら形態素やり直し
ソート用のデータが。。。(ここはわからなかった)
QA
Q:MeCabの代わりとなっているものは?
A:MeCabを改善してみる?
3.
発表者 : グリー株式会社 一井 崇
概要:全文検索のちょっとちがった使い方(仮)
グリーでの数値指標管理
事前集計してKVSに登録してみてみる
1億パターンのキーが存在する。。。
キーがわからなくなる問題とか事前集計できてる?とか迷子になる。
キーも全文検索に入れてみては?
「富士山の標高は何メートル?」とかでデータが取れる。
構造化されたキーをkey stringとして全文検索する。
構造化Keyに対応したKVSがあればいいんだけど。
データストアとしての全文検索もいいのでは。
4.
発表者:株式会社クリアコード 須藤 功平
概要:rroongaによる検索サービスの実装
groongaとRubyの組み合わせでrroonga。Rubyによるインタフェース?
groongaとのつながり部分をRubyで書いたライブラリ
多段ドリルダウン機能
絞り込みによる検索結果の比較とかに利用可能
メタデータ抽出にドリルダウンが便利
例:番組説明から出演者を抽出
サジェスト機能もある
コンテンツベース
すぐできる。候補の精度がいい
統計情報ベース
元データがある程度必要
候補が増えるけど、精度の問題あり
5.
発表者: 株式会社ぐるなび 塩畑 公一
概要: groongaの位置情報検索関連について。
2010年4月からgroongaを利用し始めた
レストラン検索、地図検索など
円形、矩形の緯度経度検索が可能。
距離算出もやってる。ソートとか用かな。
球面近似もやってる。
geoの検索速度についてパフォーマンステストしました。
Q:近似手法をいくつもサポートされてるけど必要?
A:距離計算を正確にしないと不利になるお店が出てきちゃうから
6.
発表者: クックパッド株式会社 兼山 元太
概要: Solrを使ったレシピ検索のプロトタイピング
クックパッドとは?
女性多いよ
AWS上でRubyで組んであるよ
プロトタイピングって?
ユーザの問題を発見してから、プロトタイピング
本番デプロイ(一部ユーザに公開)
問題を抱えているユーザーに向けてそれぞれ数十のバージョンが動いている
インタビューとかしてフィードバック受ける。
本番の検索エンジンのフィールドをいっぱい追加
Solrの紹介(MySQL(Tritonn)から移植しました)
ダイナミックフィールドやレプリケーションの話。
JSON型でHTTP経由で検索できるのが便利。
Solr本の紹介して頂きました!あざっす!
気になってるSolrの新機能
not to cache
SurroundQuery
BloomFilter
Q:全部AWS?
A:全部AWSに移行しました。
とまぁ、参加してきました。 初六本木ヒルズで、おしゃれな場所、雰囲気にやられてしまって、あんまりちゃんと聞けてないところがありますが。。。 メモを取りましたので。参考までに。 groongaについては勉強不足のため、いまいちついていけませんでした。 ちょっと英語の記事を読んでいたのもありまして。(内職良くない。。。) MeCabに関する発表に興味があり、勝手にMeCabの代わりorMeCabよりいいものを使ってます!みたいな発表かと想像していました。(ちょっと違ったみたい、妄想は良くないですね。。。)
グリーの方の発表は興味深かったです。ログ解析とかにも確かに全文検索の技術使えるし。 検討が進んだ次の話も聞いてみたいです groongaの位置情報の話やrroongaでのgroongaの色々な機能のはなしも出てきてgroongaの理解もちょっと進んだのはありがたかったです。
最後のクックパッドさんの話は、今回もわかりやすくて面白かったです。 検索を成長させていくという姿勢と、実際にどんな形でそれを実施されているかが楽しそうに話されててとても羨ましかったです。 次はSolrで困ってる点とか、検索のログとか利用され方をどのように解析してるのかといった話も聞きたいですね。
どうしてもSolrに思い入れがあるので、感想が偏ってるかもしれません、すみません。 気になる点やいや、こうなんだよ!ってツッコミがあれば、ぜひコメントやTweetしてもらえるとありがたいです。
comments powered by Disqus
See Also by Hugo
- Fluentd meetup in Japan #2 #fluentd に参加しました。(Jugemより移植)
- Fluentd Meetup Japanに参加しました。(Jugemより移植)
- Solr勉強会第7回に参加しました。(発表もしました)(Jugemより移植)
- 第25回Elasticsearch勉強会を開催しました。
- 第13回Elasticsearch勉強会を開催しました。#elasticsearchjp