列指向ストア

列指向ストアとは

列指向ストア (Column Store) は、データを行ではなく列 (カラム) 単位で保存するストレージ形式である。分析クエリ (SUM, AVG, COUNT) で必要な列だけを読み込むため、行指向より高速。Redshift、BigQuery、Parquet が列指向。詳細は「Redshift」を参照。

行指向 vs 列指向

行指向と列指向の違いを図で示す。

行指向 (RDS):
  Row 1: [id=1, name="Alice", age=30, city="Tokyo"]
  Row 2: [id=2, name="Bob",   age=25, city="Osaka"]
  → 1 行の全カラムを取得するのが高速

列指向 (Redshift):
  id:   [1, 2, 3, ...]
  name: ["Alice", "Bob", ...]
  age:  [30, 25, ...]
  → 特定カラムの集計が高速、圧縮効率が高い

観点	行指向	列指向
得意	1 行の取得・更新 (OLTP)	列の集計 (OLAP)
苦手	大量データの集計	1 行の取得
圧縮	中程度	高い (同じ型のデータが連続)
I/O	不要な列も読む	必要な列だけ読む
例	PostgreSQL, MySQL	Redshift, Parquet

Parquet ファイル形式

Parquet ファイル形式を図で示す。

S3 上の Parquet ファイル:
  orders.parquet
    ├── Column: order_id  [1, 2, 3, ...]
    ├── Column: amount    [1000, 2000, 500, ...]
    └── Column: date      [2026-01, 2026-01, 2026-02, ...]

Athena で S3 上の Parquet ファイルを直接クエリできる。CSV より 10〜100 倍高速。

-- Parquet: amount 列だけ読み込み (高速)
SELECT SUM(amount) FROM orders WHERE date = '2026-03';

-- CSV: 全列を読み込み (遅い)
SELECT SUM(amount) FROM orders_csv WHERE date = '2026-03';

AWS での列指向ストア

AWS での列指向ストアを以下にまとめる。

サービス	用途
Redshift	マネージド DWH (列指向)
Athena + Parquet	S3 上の列指向ファイルをクエリ
Glue	CSV → Parquet への変換

いつ列指向を使うか

いつ列指向を使うかの判断基準を以下にまとめる。

ケース	推奨
集計クエリ (SUM, AVG)	列指向 (Redshift, Parquet)
1 行の CRUD	行指向 (RDS, DynamoDB)
ログ分析	列指向 (Parquet + Athena)
トランザクション	行指向 (RDS)

詳しくは関連書籍を参照。

列指向ストアとは

行指向 vs 列指向

Parquet ファイル形式

AWS での列指向ストア

いつ列指向を使うか

関連用語

Redshift

データウェアハウス

B-Tree

N+1 問題

データ正規化

GraphQL

関連する記事

データベース本ガイド - SQL から設計まで学べる技術書の選び方

本についてくるダウンロード素材を使い倒す

エンジニアの本棚の整理術 - 増え続ける技術書を管理する