@johtaniの日記 3rd

親子で楽しめる絵本で英語をはじめる本(Jugemより移植)

親子で楽しめる絵本で英語をはじめる本 Twitterでこの本について書かれたブログ記事が流れてきて、購入しました。最近、英語を身につけておいたほうがいいなと思うことが多々あり、子供にも英語を勉強してもらいたいなと思っていたところでした。あとは、私自身が英語が苦手というのもあり、子供をダシにして勉強したいというのもありまして。。。サラっと読んでみましたが、参考になりました。特に「多読」というキーワードが面白かったです。こちらが元のようですが。多読とは、文章を分析しないで大意を把握する読書法だそうです。

2012-02-26 by johtani

第4回 Twitter API勉強会 @デジタルハリウッド #twtr_hack に参加しました。(Jugemより移植)

今週も勉強会に参加しました。 @yusukey さんが開催してるTwitter API勉強会です。前回とは会場が異なりましたが、広くて大画面で良い会場でした。駅も近いし。（デジタルハリウッドさいこー！）今回はLT枠のbootstrapの話が聞きたくて参加しました。（ムチャぶり駆動勉強会の現場をTLで目撃してたのでｗ）あと、バーチャファイター（昔、VF目当てでセガサターンを買ったなぁ、懐かしい）の話も聞きたかったので。（ごめんなさい、Twitter APIはまだ触る機会がなさそうです。。。）今回も途中で参加者同士を数グループ（座席が近い人）に分けて自己紹介タイムがあり素敵でした。ちょっと残念だったのはネームプレートが今回はなかったことでしょうか。自己紹介でツイッターID教える＋聞くのがちょっと辛かったです。（やっぱり個人名刺作ったほうがいいかなぁ）私はPCを開いていたのでTwitterのページを見せることで対応出来ましたが。（次やるときはお手伝いするのでこえかけてください。）

2012-02-24 by johtani

lucene-gosenとSynonymFilterを利用するときの注意点（問題点編）(Jugemより移植)

久々にlucene-gosenの話です。しかも、あんまり嬉しくない話しです。すでにissueをアップしていますが、lucene-gosenとSynonymFilterを併用する場合に、特定の条件下でNullPointerExceptionが発生してしまいます。条件は以下の組み合わせになります。 Solr 3.5.0以前 lucene-gosen1.2.0 - 1.2.1の辞書なしjar SynonymFilterFactoryにてtokenizerFactoryを指定根本的にはSolr側の問題のようです。SOLR-2909としてissueが上がっています。

2012-02-21 by johtani

Hadoopソースコードリーディング第8回に参加しました。#hadoopreading(Jugemより移植)

また、勉強会ログです、すみません。。。直接業務とは関係ないのですが、今回はリクルートの中野さんが話しをされるというので顔を出してきました。もちろん、内容も気になりましたというのもありますが。実際には中野さんは2分くらいしか喋らなかったんですけどね。。。

2012-02-09 by johtani

Fluentd Meetup Japanに参加しました。(Jugemより移植)

Fluentd meetup in Japanに参加しました。いつも面白そうな話を聞いてばっかりなので、役に立つためにスタッフとしても参加してみました。まずは、会場が綺麗でびっくりしました。しかも電源タップまで用意されていてかなり充実してました。Ustはまだ見ていないのですが、Ustも録画までされていて素晴らしい運営メンバーでした。

2012-02-05 by johtani

今興味があること(Jugemより移植)

昨年末に今年の抱負について書いたのですが、他にも興味あるものが増えたので備忘録＆公約？を兼ねてブログに書いておきます。（興味あるものがあれば、シェアしたりできると楽しいので、ツイート、コメント待ってます。）

2012-01-27 by johtani

モーショノロジー2012#1に参加しました。(Jugemより移植)

ということで、いつものように勉強会に参加したメモです。 http://atnd.org/events/23608 日時 :2012/01/26 19:00 to 22:00 会場 :アカデミーヒルズ(六本木ヒルズ内) 49階（タワーホールA）（港区六本木6-10-1）ハッシュタグ :#mnlgy

2012-01-27 by johtani

MapR中身説明会に参加しました。(Jugemより移植)

日時：2012/01/19 18:30-20:30 場所：ベルサール三田Room2シアター Inside MapR デモ＋内部のお話。・自己紹介 Susheel Kaushik 元YahooのHadoop系の人。製品担当責任者。草薙さん 3台のベアボーンでMapRが動いてるデモが開始。クラスタ管理画面の説明。なぜか、NFSのサービスが1台落ちてますがｗ MapReduceなんかの実行結果なども出てくるのか。ボリューム管理も画面から操作レプリケーション、スナップショットも管理画面で操作、動作確認できますよ。ミラー先はリードオンリーでボリュームの同期が可能。スナップショットによりMapRのクラスタ内部にバックアップが保持可能。 NFSのHA構成可能。VIPの機能などもあるよ。事前定義された各種Alertの発行も可能。 JobTrackerもMapRで拡張された表示がある。例：MapTaskPrefetchCapacity：次のジョブのMapperを起動する準備可能な仕組み MapR内で独自に出力してる測定値をGangliaで見ることができるよ。 MapRはHadoopの置き換えとなる製品。 HDFS部分を重点的に性能アップさせるために主に置き換えた製品。 MapReduce部分にも手を入れてる。例：Direct Shuffle（HTTPじゃなくて、RPCでShuffleの通信を行ってるとか）ボリューム活用してるらしい。分散NameNode、JavaGCの影響の排除、ビルトイン圧縮によるI/O削減など。 Mapperの出力をHDFSに置くと、メタデータ更新が多くなり、NameNodeがパンクする。（Apache Hadoop） Q：中間データもレプリケーションすると性能劣化しないんですか？ A：中間データボリュームは特定ノードしか保持されない（＝レプリカ数は１）ストレージプール（SP）ソフトウェアでストライピング。RAIDしなくてよい。コンテナ（データ、ネームがある。）データブロックをグループ化したもの ※ストレージプールの数と同数のボリュームを作成すべき。 CLDBがコンテナを管理してる。 Q：トランザクション失敗するのは？ A：どこかにかければトランザクションは成功。コンテナが復旧してきたら、データがコピーされる。復旧されない場合は別途コンテナを割り当てることもある？ Q：ノードが追加される場合の挙動は？ A：。。。聞き逃した。トポロジノードを階層的にグループ化してデータ配置をコントロール。 Q：トポロジ設定などの権限設定は？ A：Permission画面があるよ。 Q：ボリューム単位のファイルシステムアクセスに関する設定は？ A：？？？聞き逃した？ボリュームいろいろな設定が可能。スナップショット Copy-on-Write方式による差分格納ミラーソースからミラーにコピー。手動orスケジュールによる起動が必要。ミラー側はRead-only ※誤解を招きやすいので注意読み出しが多い場合にミラーを利用することで対応が可能。ビルトイン圧縮 LZZFの一種を高速化してるネットワークIOにも効いてくる JobTracker HA 最大３ノードで構成可能。アクティブスタンバイ NFS HA すべてのノードで稼働可能。 NFS機能 NFSv3相当クライアント側にNFSサービスをインストールするという構成も可能に。 Q：NFSマウントして作成したファイルもブロックサイズ分のファイルサイズになるの？ A：8Kバイト単位で内部的にはファイルを作成してる。8KB単位で圧縮して管理してるので、小さいサイズでもいい。（アロケーションサイズが8KB） Q：8KBにしてしまったために大きなブロックサイズの利点がなくなるのでは？ A：オーバーヘッド内容な構成になってる。シーケンシャルに8KBに並んでるから？ Q：NFSによるとMapReduceによるアクセスの排他制御とかは？ A：独自で頑張らないといけない。Job起動時に効果的にスナップショット取ったりはしてない。リバランスもバックグラウンドで実行可能 Apache Hadoopが備えるJava APIは100%語幹 Q：なんで、HDFSをがりっと書き換えたの？ A：運用性も、ノード管理も。。。全部です。なくなっても良いデータなら、別にHadoopでもいいですよね。けど、基幹システムとかだと、信頼性が必要だし、運用の効率も必要だしいろいろ必要。 Q：実績が必要なんですが、どのような試験を行われているのかという情報が公開される？EMCでやられてるテストのプロセスを適用しているなどの裏付けは公開されないの？ A：内部で6ヶ月利用してデータロスはない。品質については強化していく。 Q：MapRとしてHadoopコミュニティへの還元していく内容ってどんなもの？ A：Apacheコミュニティに対して1000台のクラスタを提供してスケーラビリティテストとかやってくださいとしている。 Q：このクラスタを実際にはどう使ってもらうの？ A：品質アップするためにテスト環境として使ってもらう？ Q：ApacheのAPIの互換性を死守するのが必ずしもいいとは思えない場合にどうするの？MapR独自APIとかは出さないの？ A：ApacheのAPIに準拠するのは非常に重要。他のHadoop上のアプリが動作しなくなるから。 Q：MapRを容量の大きなファイルシステムとしてだけ利用するなんて想定はありますか？MapReduceを利用しないパターンです。 A：いや、それはｗ Q：MapRはエンタープライズがターゲットだけど、Amazonはパブリッククラウドが対象。マルチテナントなパブリックサービスでMapRを利用するとかは？ A：。。。 Q：ジョブ管理にも手を入れてるの？ A：あんまり手を入れてません。 Q：EMCのストレージ製品でMapRのMapReduceない版みたいの出てない？ A：中身はMapRじゃないですよ。想定とは異なり、日本の草薙さんが主に説明されたのですごくわかりやすかったです。しかもかなり内部まで理解されている方だったので突っ込んだ質問にもきちんと回答されてるので更に理解が進みました。今回利用された資料は現時点では公開の予定はないという話でした。ただ、かなりまとまってる資料なので、後悔して欲しいものです。普通にviとかしてるだけなのに、すごいと思うデモってなんか新鮮でした。 MapR自体を触る機会はまだまだないと思うのですが、MapRとしてHadoopに対する思想が垣間見えたのが面白かったです。すごいメンツが質問を投げまくるのでいろいろな側面で話が聞けました。ただ、やっぱり英語のヒアリングがダメダメだというのが露呈しました。。。今年は少し頑張らないと、先が思いやられますね。。。あと、疑問と言うか、感想ですが、MapR自体が結構多機能で、その機能をどう扱うか、どのようなノード構成やボリューム構成を取るかといった設計が結構大事でしかも大変なんじゃないかなぁという印象を受けました。特にマルチテナントで利用する場合などは、想定されないミラーの利用などでデータ容量が足りなくなったりといった側面も出てくるのかなぁと。

2012-01-20 by johtani

OSSAJのミニセミナーで話しをしてきました(Jugemより移植)

お久しぶりです。インフルエンザで一家全滅という最悪の状況に陥っていた我が家でした。流行してるみたいなのでみなさんも気をつけてください。さて、そんな中、OSSAJのミニセミナーでSolrについて簡単に話しをしてきました。人生初Ustだったのですが、ぶっ倒れている中作成した資料だったためなんとも情けない発表だった気がします。（言い訳カッコ悪いですね。。。）関係者の皆様、申し訳ございませんでした。

2012-01-19 by johtani

lucene-gosenのLucene/Solr4.0対応ブランチ更新(Jugemより移植)

先日のSolr勉強会でLucene/Solr4.x系のlucene-gosenについて質問を受けていたのを忘れないように（年越しちゃいました、すみません。）先週金曜日（1/6）にissueに登録しました。まずは忘れないようにと思って、登録だけして3連休に突入したのですが、Robertさんが1/7に対応してくれました。 Lucene/Solr 4.x系では3.x系とはパッケージやメソッドが変更されるなど少し異なる部分があります。 lucene-gosenでは、プロジェクトのページにもあるとおり、4.x系にも対応しています。ただ、この4x系に対応したブランチが、2011年5月から放置されていました。

2012-01-08 by johtani

親子で楽しめる絵本で英語をはじめる本(Jugemより移植)

第4回 Twitter API勉強会 @デジタルハリウッド #twtr_hack に参加しました。(Jugemより移植)

lucene-gosenとSynonymFilterを利用するときの注意点（問題点編）(Jugemより移植)

Hadoopソースコードリーディング第8回に参加しました。#hadoopreading(Jugemより移植)

Fluentd Meetup Japanに参加しました。(Jugemより移植)

今興味があること(Jugemより移植)

モーショノロジー2012#1に参加しました。(Jugemより移植)

MapR中身説明会に参加しました。(Jugemより移植)

OSSAJのミニセミナーで話しをしてきました(Jugemより移植)

lucene-gosenのLucene/Solr4.0対応ブランチ更新(Jugemより移植)

FEATURED TAGS

ARCHIVE BY YEAR

親子で楽しめる 絵本で英語をはじめる本(Jugemより移植)

第4回 Twitter API勉強会 @デジタルハリウッド #twtr_hack に参加しました。(Jugemより移植)

lucene-gosenとSynonymFilterを利用するときの注意点（問題点編）(Jugemより移植)

Hadoopソースコードリーディング第8回に参加しました。#hadoopreading(Jugemより移植)

Fluentd Meetup Japanに参加しました。(Jugemより移植)

今興味があること(Jugemより移植)

モーショノロジー2012#1に参加しました。(Jugemより移植)

MapR中身説明会に参加しました。(Jugemより移植)

OSSAJのミニセミナーで話しをしてきました(Jugemより移植)

lucene-gosenのLucene/Solr4.0対応ブランチ更新(Jugemより移植)

FEATURED TAGS

ARCHIVE BY YEAR

親子で楽しめる絵本で英語をはじめる本(Jugemより移植)