目次
概要: Lucene/SolrのコミッターであるRobert Muirさんが始めたプロジェクト
歴史: MeCabのJava移植版としてスタートしたSenがベースになります。 その後、辞書の構築部分をPerlからJavaに置き換えたGoSenが登場しました。 が、どちらもメンテナンスされなくなってきたので、Robertさんが引き継いでメンテナンスとLucene/Solr対応をはじめました。そして、現在にいたります。
ライセンス: LGPLライセンス(ベースになったMeCabのライセンスにならって)
特徴: 以下のような特徴があります。 ・Lucene/Solrですぐに利用可能(3.1、4.0に対応済み) ・jarファイル1つで利用可能(辞書をjarファイルに内包) ・LuceneのAttributeをベースにしたTokenの解析 ・その他(パフォーマンス改善、テスト改善など)
プロジェクトのサイト: http://code.google.com/p/lucene-gosen/
ダウンロード: http://code.google.com/p/lucene-gosen/downloads/list 現時点では2つの辞書を内包したjarファイルが用意されています。
Naist-jdic 0.4.3(for ChaSen) 参考サイト:http://sourceforge.jp/projects/naist-jdic/ IpaDic 2.6.0 参考サイト:http://sourceforge.jp/projects/ipadic/
comments powered by Disqus
See Also by Hugo
- Apache LuceneのKuromojiのUniDicビルド対応パッチについて
- lucene-gosenのLucene/Solr4.0対応ブランチ更新(Jugemより移植)
- 辞書の外部化とLucene/Solr3.4対応(Jugemより移植)
- 辞書のjarファイルからの分離(Jugemより移植)
- Lucene/Solr 4.0.0リリース&lucene-gosenの4.0対応(Jugemより移植)
FEATURED TAGS
aws
azure search
berlin buzzwords
bot
cloudera
cloudera search
conference
curator
dev container
diyキーボード
elastic
elasticsearch
fluentd
hadoop
hugo
java
kibana
kuromoji
logstash
lucene
lucene-gosen
manifoldcf
marvel
misc
morphlines
music
nlp100
octopress
opensearch
paper
plugin
python
riak
rust
rust-the-book
search
shield
solr
visual studio code
wikipedia
windows
workplace search
yokozuna
zipkin
オライリー
ブログ
備忘録
勉強会
振り返り
本
検索
読書
転職