groongaを囲む夕べ
11/29の夜、渋谷へ行って 全文検索エンジンgroongaを囲む夕べ 3 @groonga : ATND に参加してきた。
とりあえず備忘のためのメモ。
それにしても発表者のgroongaへの愛の深さを感じるセッションが多かった。
groongaの紹介
- DBを複数プロセスで共有可能。
- コア数が多い環境に強い。リアルタイムウェブ向き。
- クエリの計算量
- key usec単位
- index msec単位
- fulltext 10-100ms単位
- tablescan sec単位
- groonga 2.0.9
- 高度な検索機能サポート
- fluentを使ったレプリケーション
- 今後
テストデータにWikipediaを使っている。
広告配信システムでgroongaを使った話
- rrongaを経由している。
- なぜ、groongaを使ったのか。
- 製品データを取り回しやすい。シンプルに実装できた。
- DB用サーバを用意しなくていい。APサーバだけでおk
- 導入コストが安い。
nanapiでの利用。
- ハウツーを蓄積するWebサービス
- tritonn→mroongaに更改
- mroongaのwrapper modeを利用
- nanapiでは記事の複数バージョンの保持が必要だった。
- TokyoTyrantのようなKVSも併用
- 検索サジェストの表示にもmroongaを使っている。
- 階層が非常に深い(10000超)ディレクトリを持っている
- 複合インデクスを利用
- mroongaで困ったこと。
- バグっぽい挙動があったが2.0.9で修正された。
- mroongaにあるといいな
- マルチセクションでの重み付け
rroongaで生放送コメントを検索(ニコ番)
外資就活ドットコムのサイト内検索
アニメを録画した後の話しをします
mroongaを使った高速な対訳検索・ダウンロードシステム
Amazon CloudSearch APIをgroongaで実装したら
- Amazon CloudSearch
- 今はまだベータ版
- Amazon CloudSearchは有料・・・
- 日本語データが格納できない・・・?
- Amazon CloudSearch互換のAPIをgroongaをベースに!
- OSS、日本語OK、無料!
- 管理コンソールもあり(gcs)
そういえば、勉強会聞きながら手元の環境で11/29にリリースされたばかりのgroonga 2.0.9をビルド&インストールしてたんだけど、2.0.8で発生していたインストール時の問題が2.0.9では発生しなかった。いったい何だったんだろう・・・。>2.0.8でのインストール失敗