@johtaniの日記 3rd

@johtani's blog 3rd edition

オープンソースへの貢献のススメ(Jugemより移植)

録画してたEテレのスーパープレゼンテーションを見ててふと書きたくなったので、書いてます。あとから読んだら恥ずかしくなりそうだけど。。。「“知力の余剰"が世界を変える」というClay Shirkyさんの話を見て思ったことです。社会的に貢献できる仕組みが最近増えているという話の内容でした。そこで、OSSについても同じことが言えるよなぁと思った次第でして。

2012-05-31 by johtani

JJUG CCC 2012 Springに参加してきました。(Jugemより移植)

JJUG CCC 2012 Springに参加してきました。昨年のFallに続き、2回目です。概要や、タイムテーブルはこちらを御覧ください。今回は、午後一から参加しました。色々と迷いましたが、つぎのを聞いて来ました。

2012-05-29 by johtani

PlayFramework 2.0(Javaの方)を触ってみてる(Jugemより移植)

PlayFramework2.0を触ってみてます。ちょっとコーディングしたくなったのと、最近のアプリの作成の調査も兼ねて。まぁ、せっかくなので、Solr検索のアプリでも作ってみようかと言うことで触ってます。ただ、Solr検索アプリでしかなく、今のところDBを使わないので、実はPlay Frameworkじゃなくてもいいのではないかという疑問も。。。

2012-05-16 by johtani

lucene-gosen 2.0.1リリース（Java7対応）(Jugemより移植)

lucene-gosenの最新版（2.0.1）をリリースしました。プロジェクトページよりダウンロードが可能です。今回の修正では、Java7でUnicodeのバージョン変更に伴う対応（詳細はこちらを参照）を行なっています。リソース周りの対応はまた後日。。。すみません。2012/05/16 遅くなりましたが、昨晩、JavaDocをアップしました。

2012-05-09 by johtani

「IDの秘密」を読みました。(Jugemより移植)

IDの秘密 (丸善ライブラリー―情報研シリーズ) 非常に面白く読めました。バーコードの話に始まり、最後はシステムで付与するIDに関する考慮点まで幅広くIDについて語られています。

2012-04-30 by johtani

Heroku JP Meetup ＃4に参加しました。#herokujp(Jugemより移植)

WebSolrの話があるらしいというのを嗅ぎつけて、初めてHeroku JP Meetupに参加しました。 herokuもWebSolrも知りつつ、手を出していなかったので、いい機会でした。（SignUpだけ、勉強会直前に済ませましたｗ）

2012-04-21 by johtani

Solr 3.6.0のCJKの設定とSynonymFilterFactoryの気になる点(Jugemより移植)

先日、Solr入門のサンプルschema.xmlの3.6.0対応版の作成をしていて、気になったことがあったので、メモとして残しておきます。 SynonymFilterFactoryの属性「tokenizerFactory」に関連する話です。（「Apache Solr入門」の36-37ページに記載があります。）

2012-04-17 by johtani

「Apache Solr入門」のサンプルのKuromojiとlucene-gosen対応（2章～4章）(Jugemより移植)

先日の続きです。「Apache Solr入門」の2章から4章の説明について、Solr3.6.0で動作させる時の変更点を以下に書いていきます。なお、前回も説明しましたが、3.6.0からKuromojiという形態素解析器がSolrに同梱されるようになりました。これから説明する2章の変更点の手順ですが、Kuromojiとlucene-gosenそれぞれの利用方法について説明します。添付のschema.xmlについては、基本的にKuromojiを利用する形に変更してあります。それに加えて、lucene-gosen用のフィールドを別途追加で定義しました。これらのフィールド名については、次の表の用になります。適宜、書籍のフィールド名と置き換えながら読み進めたり、試したりしてください。

2012-04-14 by johtani

Lucene/Solr 3.6.0リリース / 「Apache Solr入門」のサンプルのKuromojiとlucene-gosen対応（1章）(Jugemより移植)

以前より、アナウンスしていた、Kuromojiという日本語形態素解析が含まれるLucene/Solr 3.6.0がリリースされました。以下、各リリース内容について簡単に説明されているページへのリンクです。

2012-04-14 by johtani

【メモ】Amazon CloudSearchが出てきましたよ(Jugemより移植)

Twitterでこのブログ流れてきて、気になったので、流し読みして簡単にメモ。 Amazonのサービスでスケールする検索サービスみたい。主に、機能面です。価格とかはみてないです。データと検索トラフィックに対して自動でスケール（※automaticってのがどういう感じかは調べてないです） CloudSearch APIsでアクセス可能。AWS管理コンソールからオペレーションできる。コマンドツールもあるデータ登録にHTTPSも使えますよ。データ形式はJSON、XML、SDF（Search Document Format）と呼ばれるものに準拠したもの near real-timeで検索可能になる。RAMにインデックスを保持して更新処理が早くなる（Lucene/Solrと一緒か？）ステミングとかストップワードの設定変えたらre-index ファセット、フィールド指定検索が可能。（ファセットはファセットクエリみたいなのもできるのかな？）データ量が増えたら、サーチインスタンスを追加するか、インスタンスタイプを大きくしてスケールする？トラフィックが増えたら新しいインスタンスにデータをレプリケートしてインスタンスを追加する簡単に実現できるよ。ファセット検索、全文検索、And/OR検索式、ランキングのカスタマイズ、フィールド指定ソート、フィールド指定検索、テキスト処理オプション（ストップワード、類義語、ステミングのような）ここから詳細のドキュメントが見れるみたいなので、また、見てみます。

2012-04-12 by johtani