Bigtable
分散コンピューティングの有用性はSETI@homeプロジェクトで実証されたわけですが、分散させるという発想は、その後のインターネットにも大きな影響を与えました。
特に、データベースにおいては、集中させるよりも分散させたほうがより利便性がよくなるということが、Googleによって実証されました。
データベースは、現在でも情報工学の重要な研究分野の一つになっており、ITを語る上では最も重要なテーマの一つでもあります。
Googleの持つBigtableは、非常に大きなサイズに拡張できるように設計されており、構造化されたデータを管理するための分散ストレージシステム
(原文:Bigtable is a distributed storage system for managing structured data that is designed to scale to a very large size: petabytes of data across thousands of commodity servers.)だそうです。
何を言っているかよくわからないとも思いますが、とりあえず、このBigtableという分散ストレージシステムのおかげで、GoogleReaderやGoogleマップ、Googleアース、Blogger、YouTubeなどが使えているのは事実です。
ちなみに、この技術は、Google以外では提供されていません。
Bigtableについて、書籍やネット上の文献などを見ていると、どうも単純な分散ストレージシステムという訳でもないようなのです。
分散データベースというと、物理的に分散しているデータベースも含まれますが、分散させる分だけコストが増えていくわけです。特にOracleなどの商用データベースは規模を大きさと比例してコストも高くなります。
この方法だと、いずれコスト的問題で拡張ができなくなってしまうわけですが、Bigtableはその問題を「列指向データベースマネジメント」で解決しています。
参考
- Bigtable: A Distributed Storage System for Structured Data
- BigTable(ビッグテーブル)
- The Google File System
- Oracle Database 管理者ガイド
- Googleの巨大分散データストアBigtableとDatastoreを理解する
- 列指向データベースマネジメントシステム
- MapReduce: Simplified Data Processing on Large Clusters
- 見えるグーグル、見えないグーグル
- MapReduce
- GoogleのMapReduceアルゴリズムをJavaで理解する
- オブジェクトデータベース
-
前の記事
【今さら聞けない】重くて送れないファイルをメールで送る方法 2012.07.07
-
次の記事
Facebookの活用法:イベント管理 2012.07.07