@johtaniの日記 3rd

@johtani's blog 3rd edition

インデックスエイリアス - Azure Cognitive Searchの新機能

Azure Cognitive Searchで2月に新しい機能が公開されました。 「Index Alias」(インデックスの別名)です。まだ、パブリックプレビューの段階ですが、ドキュメントなどが公開されていたのでどんな機能かを調べてみました。なお、本ブログの内容は2022/05/18時点での内容となります、ご注意ください。

Azure Cognitive SearchのIndex Schema JSONをCSVで見たくなる

Azure Cognitive Searchのスキーマの確認をするときに、Azureのポータルでは次のようにフィールドの一覧として見ることができます。 ただ、実際のインデックス定義はJSON形式でやり取りする形になっています(JSONの例:Create Index | Microsoft Docs)。 上記のスクリーンショットのようにフィールド数が少ない場合はそれほど気にならないのですが、フィールド数が大きくなると一覧で見たくなることがあります。 また、ポータルを自分で確認できない場合にJSONファイルを受け取って確認することもあります。 こういう時は、Excel(CSV)って便利ですよね?

Azure Cognitive Searchの新機能、Semantic Searchを試してみた

Azure Cognitive Searchで新機能「Semantic Search(セマンティック検索)」という機能の日本語対応が発表されました。 実際にはPublic Previewという状態ではありますが、どんな機能か気になったので調べてみました。 なお、本ブログは2021年6月時点での内容となります。

OData式と日本語の検索(NGram)とフレーズ検索

Azure Cognitive SearchにはOData式という書式で条件が書ける仕組みがあります。 ODataは検索条件($filter)やソート条件($orderby)、取得する項目名の指定($select)です。

Azure Cognitive Searchでオートコンプリートやサジェストをしてみる

Azure Cognitive SearchにSuggestやAutocompleteの機能があるのを見つけたので、どんな挙動なのかを調べてログとして残しておきます。 公式ドキュメント 日本語で公式ドキュメントが公開されています。使い方や流れについてはこちらをまずは見れば使えると思います。

TerraformでAzure Cognitive Searchのクラスターを起動

負荷を計測するために、数回、Azure Cognitive Searchのクラスターを起動したり、停止したりしてました。 これは、Terraformでやると楽できるのでは?と思ったので、やってみました。 1パーティションのクラスターなので、全然大したことはないのですが、メモを残しておくためにブログに書いておきます。

Azure Cognitive Searchでの日本語向けAnalyzerの違い

Azure Cognitive Searchで日本語を扱うときに、形態素解析器を使いたい場合、2種類のAnalyzerが用意されています。今回はこれらの違いがどんなものかを見ていくことにします。

Azure Cognitive Searchのリクエストのロギング

今回はAzure Cognitive SearchのSDKを利用したアプリケーションが、実際にAzure Cognitive Searchに対して送信しているリクエストのパラメータとボディをログに保存する方法について紹介します。

Microsoft Build(2020)のAzure Cognirive Searchのセッションを見たのでメモ

Mircosoft Buildというイベントが今週ありました(MSの方やお客さんに教えてもらった)。 そこで、Azure Cognitive Searchのセッション(MyBuild - Cognitive Search: The pocket-knife for knowledge mining)があったので、見てみました。 内容がどんなものかをメモっておきます。 最初はCognitive Searchがどんなものよという説明でした。

Visual Studio Codeのプラグインを作ってみた(Azure Search Analyze Client)

動機 Azure Cognitive Searchを検索エンジンに使っているお客さんを手伝っています。 そこで、検索の基本的な話をさせていただきました(もともとJJUGナイトセミナーでしゃべる予定だったスライドがベース)。 で、Elasticsearchなどの転置インデックスを利用している検索エンジンで検索の基本的な動作がどうなっているかを理解するのに、 個人的には一番重要だと思っているのがAnalysis(Analyze)の機能です。 転置インデックスの単語の切り出し方がどうなっているかによって、望んだ単語でうまく検索できているかいないかなどがわかります。