りおパパの日記

徒然なるままに。ドトールのコーヒーが好きです。

カラム型DB、インメモリーDB

ビッグデータという言葉には少し抵抗があって、なかなか真面目に勉強していなかったのだけど、最近少しDBの技術が気になっています。カラム型DBとかインメモリーDBとか、少しだけわかった気になって興味が持てるようになってきました。まず、カラム型DB。通常のRDBが行方向を一塊のデータとして扱うのに対し、カラム型DBは列方向にデータをひとまとまりとして扱うため、特定の列の値をまとめて処理することに長けている。具体的には集計などの高速処理が可能。反面、オンライントランザクション処理は構造上苦手。また列方向データは圧縮効率が高く、データの一貫性を維持するためのロック処理が実務上ほとんど必要とされないため、分散処理、並列処理を実装しやすいという特徴を持っている。一方インメモリDBはデータベースをメインメモリ上に保持する技術で、メモリ上のデータアクセスに最適化したデータ構造とアルゴリズムを持っているため、通常のDBをメモリ上に展開するよりはるかに高速な処理を可能とするものらしい。ま、もう少し勉強ですな。
SAPのHANA、IBMのNetezza、HPのVertica、オラクルのExadata、およびNoSQLのDBの代表例であるCassandoraがカラム型DBの機能を備えているらしい。