ライブドア テクニカルセミナー個人的まとめ その2

ずいぶんと遅れましたが,ライブドアテクニカルセミナーまとめその2です.

2人目に発表された方はLivedoor情報環境技術研究室の浅田 拓也さん.
発表内容は,RADOSを用いたスケーラブルなEucalyptus向け分散ストレージの実現.
個人的な大本命でした.

発表の冒頭はEucalyptusの説明.
Eucalyptusは,AmazonクラウドのクローンをOSSで作ろうというプロジェクトから生まれたソフトウェア.
EucalyptusはほぼAmazonEC2,S3,EBSとAPIでの互換性があります.
自分でクラウド環境が作れる!ということで社内プライベートクラウドパブリッククラウドサービス等に利用できます.

Eucalyptusについては,また他の日に書くとしてEucalyptusの問題としてWaltusと呼ばれるストレージにローカルディスクしか利用できない問題があります.
ローカルディスクしか利用できないので,ストレージがスケールしません.
そこで,最近Linuxに実装された分散ファイルシステムであるCephをEucalyptusに導入しようという内容でした.
Cephとは,カルフォルニア大学サンタクルーズ校で開発された大規模分散ファイルシステムです.
特徴として数ペタバイトまでスケール可能.高いパフォーマンス,高信頼性が挙げられます.

Cephは,ストレージクラスタメタデータクラスタ,モニターで構成されます.
クライアントは,メタデータ操作はメタデータサーバに,ファイルIOはストレージサーバにアクセスします.
メタデータとデータは,分離して管理され独立しています.

タイトルに入っているRADOSとは,ストレージクラスタのことを言います.
Reliable, Autonomic Distributed Object Store
の略で信頼性があって自律的な分散オブジェクトストアということらしいです.
データ自体はオブジェクト単位で管理されノード群にバランス良く配置されます.

RADOS for Eucalyptusでは,WalrusやSCのバックエンドをRADOSに入れ替えます.
方法として2通り検討したらしいのですが,作業量の関係からWalrusをRADOSに対応させる方法ととったそうです.
RADOS APIC/C++用なので,
JavaへのブリッジをJNIで実装したそうです,

テスト自体は,時間の関係で1ノードでの実験でした.
ローカルディスクと比較するとネットワーク越しで利用するRADOSのほうが遅いのは自明だったのですが,結果は60〜70%の性能ダウンという結果でした.
ですが,Cephの論文を見るとそこまでの性能低下は起こっていなかったため設定の問題?と言った結論でした.