目次
開発中ですと書きました、elasticsearch-extended-analyzeですが、改良しました。
改良と変更は以下のとおりです。
- ソースのパッケージを
org.elasticsearch
からinfo.johtani
に。MLで気になったので質問したら、変えたほうがいいよとのこと。ダウンロード化については、もう少々お待ちを。 - 出力形式を変更。可能な限りCharFilter、Tokenizer、TokenFilterそれぞれが出力する内容を返すようにしました。
- ただし、既存のAnalyzer(JapaneseAnalyzerクラスとか)に関しては、現時点では出力しません。CharFilterなどを取得するI/Fが見えないためです。(改良できるかの調査は未着手)
現時点でできてないのは以下の項目
- pluginコマンドでインストール
- 出力したいAttributeの指定
- TokenizeChainで変更されたTokenの追跡(現状はどのTokenがStopFilterで消されたかなどが不明)
- 画面の用意(簡単に確認できる画面)
ということで、README.mdに出力サンプルは貼り付けてるので、興味のある方は試してみてください。 不明点などあれば、コメントかIssueかツイートでも。
comments powered by Disqus
See Also by Hugo
- elasticsearch-extended-analyzeプラグインを開発中
- いつも入れているElasticsearchのプラグイン
- elasticsearch-kopfの紹介(analysis画面)
- Extended-Analyze 1.0.0RC1をリリースしました
- elasticsearch-extended-analyzeを公開?
FEATURED TAGS
aws
azure search
berlin buzzwords
bot
cloudera
cloudera search
conference
curator
dev container
diyキーボード
elastic
elasticsearch
fluentd
hadoop
hugo
java
kibana
kuromoji
logstash
lucene
lucene-gosen
manifoldcf
marvel
misc
morphlines
music
nlp100
octopress
opensearch
paper
plugin
python
riak
rust
rust-the-book
search
shield
solr
visual studio code
wikipedia
windows
workplace search
yokozuna
zipkin
オライリー
ブログ
備忘録
勉強会
振り返り
本
検索
読書
転職