lucene-gosenとは(Jugemより移植)

Posted by johtani on Monday, May 23, 2011

目次

概要:  Lucene/SolrのコミッターであるRobert Muirさんが始めたプロジェクト  

歴史:  MeCabのJava移植版としてスタートしたSenがベースになります。  その後、辞書の構築部分をPerlからJavaに置き換えたGoSenが登場しました。  が、どちらもメンテナンスされなくなってきたので、Robertさんが引き継いでメンテナンスとLucene/Solr対応をはじめました。そして、現在にいたります。

ライセンス:  LGPLライセンス(ベースになったMeCabのライセンスにならって)

特徴:  以下のような特徴があります。  ・Lucene/Solrですぐに利用可能(3.1、4.0に対応済み)  ・jarファイル1つで利用可能(辞書をjarファイルに内包)  ・LuceneのAttributeをベースにしたTokenの解析  ・その他(パフォーマンス改善、テスト改善など)

プロジェクトのサイト:  http://code.google.com/p/lucene-gosen/

ダウンロード:  http://code.google.com/p/lucene-gosen/downloads/list  現時点では2つの辞書を内包したjarファイルが用意されています。

 Naist-jdic 0.4.3(for ChaSen) 参考サイト:http://sourceforge.jp/projects/naist-jdic/  IpaDic 2.6.0 参考サイト:http://sourceforge.jp/projects/ipadic/  


comments powered by Disqus

See Also by Hugo


Related by prelims-cli