目次
概要: Lucene/SolrのコミッターであるRobert Muirさんが始めたプロジェクト
歴史: MeCabのJava移植版としてスタートしたSenがベースになります。 その後、辞書の構築部分をPerlからJavaに置き換えたGoSenが登場しました。 が、どちらもメンテナンスされなくなってきたので、Robertさんが引き継いでメンテナンスとLucene/Solr対応をはじめました。そして、現在にいたります。
ライセンス: LGPLライセンス(ベースになったMeCabのライセンスにならって)
特徴: 以下のような特徴があります。 ・Lucene/Solrですぐに利用可能(3.1、4.0に対応済み) ・jarファイル1つで利用可能(辞書をjarファイルに内包) ・LuceneのAttributeをベースにしたTokenの解析 ・その他(パフォーマンス改善、テスト改善など)
プロジェクトのサイト: http://code.google.com/p/lucene-gosen/
ダウンロード: http://code.google.com/p/lucene-gosen/downloads/list 現時点では2つの辞書を内包したjarファイルが用意されています。
Naist-jdic 0.4.3(for ChaSen) 参考サイト:http://sourceforge.jp/projects/naist-jdic/ IpaDic 2.6.0 参考サイト:http://sourceforge.jp/projects/ipadic/
comments powered by Disqus
FEATURED TAGS
aws
azure-search
berlin-buzzwords
cloudera
cloudera-search
conference
curator
dev-container
diyキーボード
elastic
elasticsearch
fluentd
hadoop
hugo
java
kibana
kuromoji
logstash
lucene
lucene-gosen
manifoldcf
marvel
misc
morphlines
nlp100
octopress
paper
plugin
python
riak
rust
rust-the-book
search
shield
solr
visual-studio-code
wikipedia
windows
workplace-search
yokozuna
zipkin
オライリー
ブログ
備忘録
勉強会
振り返り
本
検索
読書
転職