日本語Wikipediaをインデクシング(Kuromojiバージョン)
前々回紹介した、日本語Wikipediaのデータをインデックス登録する記事の続きです。
今回は、Kuromojiのアナライザを利用してインデックス登録してみます。
余談(Proxy環境でのプラグインインストール) ElasticSearchのpluginコマンドはJavaで実装されています。(org.elasticsearch.plugins.PluginManager) プラグインのダウンロードには、java.net.URL.openConnection()から取得URLConnectionを使用しています。