@johtaniの日記 3rd

@johtani's blog 3rd edition

ElasticsearchのアーキテクチャとStateless / Serverless

本記事は情報検索・検索技術 Advent Calendar 2022の9日目の記事です。 だいぶ間が空いてしまいましたが、日本語のオートコンプリートに関する記事の続きです。

ローマ字入力のゆれと読み(JapaneseCompletionAnalyzerその2)

前回は日本語用オートコンプリートのためのAnalyzerとして、どうやって使うのかを簡単に紹介しました。 今回はもう少し、いろんなパターンを試

日本語用オートコンプリートのためのAnalyzer

風のうわさで、日本語用のオートコンプリートのためのTokenFilterとAnalyzerがLuceneに取り込まれたと聞きました(LUCE

Hugoをアップデートした

Hugoを0.84から0.92にアップデートをする際に、これまでのブログ記事やレイアウトファイルを修正したので個人的にメモを残しておきます。

Querqyの調査(その2:アーキテクチャ)

今回はQuerqyのElasticsearchのプラグインがどんなつくりになっているか?をちょっとだけ調べてみました。 SolrでもElast

Querqyの調査(その1)

Querqyというクエリのリライト用のプラグインがあるのでどんなものかを調べてみました。とりあえずは概要をドキュメントから追いかけてみた感じ

今年もオンラインでBerlin Buzzwordsに参加した

今年もBerlin Buzzwordsにオンライン出張してました。 今年はハイブリッドな開催だったようで、現地で再開している人もいるようでした。

Elasticsearchの新しいJavaクライアント

7.16で正式リリースされましたが、Elasticsearchの新しいJavaのクライアントが出ています。 使ってみたので、ちょっとだけ紹介で

インデックスエイリアス - Azure Cognitive Searchの新機能

Azure Cognitive Searchで2月に新しい機能が公開されました。 「Index Alias」(インデックスの別名)です。まだ、パブリックプレビューの段階です

Extreme Multi-label Learning for Semantic Matching in Product Searchという論文を読んだ

年末までに知り合いと次の論文を読んだので軽くまとめておきます。 Extreme Multi-label Learning for Semantic Matching in Product Search なんで読んだの? 前回読んだ理由と一緒ですが、Semantic