キャッシュは一種類じゃない。層で考えるキャッシュ戦略

この記事の対象読者

「キャッシュ」と聞くと、なんとなくRedisを思い浮かべる人
キャッシュを入れたのに、なぜか速くならない経験がある人
本番環境でキャッシュ関連の障害を経験したことがある人
システム設計でキャッシュをどこに入れるべきか悩む人

この記事では、キャッシュの基本概念から、7つのキャッシュ層、4つのキャッシュパターン、実務で遭遇する問題とその対策まで、体系的に解説します。

キャッシュとは何か？

一言で言うと

キャッシュ とは、「同じ計算や取得を繰り返さないように、結果を一時保存する仕組み」 です。

なぜキャッシュが必要なのか

    graph LR
    subgraph キャッシュなし
        U1[ユーザー] --> A1[アプリ] --> DB[DB] --> A2[アプリ] --> U2[ユーザー]
        Note1["毎回DBにアクセス（遅い）"]
    end

    subgraph キャッシュあり
        U3[ユーザー] --> A3[アプリ] --> Cache[キャッシュ] --> U4[ユーザー]
        Note2["2回目以降は高速"]
    end

キャッシュの本質

キャッシュは 「時間とスペースのトレードオフ」 です。

項目	キャッシュなし	キャッシュあり
速度	遅い	速い
メモリ使用量	少ない	多い
データの鮮度	常に最新	古い可能性がある
複雑さ	シンプル	複雑

キャッシュを入れる = 複雑さを受け入れる ということを忘れてはいけません。

7つのキャッシュ層

キャッシュは「どこに置くか」で性質が大きく変わります。

    graph TD
    User["ユーザー（ブラウザ）"]
    L1["① ブラウザキャッシュ<br/>（最も高速、ユーザーに最も近い）"]
    L2["② CDNキャッシュ<br/>（世界中に分散、静的コンテンツに最適）"]
    L3["③ リバースプロキシキャッシュ<br/>（Nginx, Varnish）"]
    L4["④ アプリケーションキャッシュ<br/>（Redis, Memcached）"]
    L5["⑤ ORMキャッシュ<br/>（クエリキャッシュ、エンティティキャッシュ）"]
    L6["⑥ データベースキャッシュ<br/>（バッファプール、クエリキャッシュ）"]
    L7["⑦ ハードウェアキャッシュ<br/>（CPU L1/L2/L3、ディスクキャッシュ）"]

    User --> L1
    L1 --> L2
    L2 --> L3
    L3 --> L4
    L4 --> L5
    L5 --> L6
    L6 --> L7

    style L1 fill:#e1f5ff
    style L2 fill:#e8f5e9
    style L3 fill:#fff3e0
    style L4 fill:#fce4ec
    style L5 fill:#f3e5f5
    style L6 fill:#e0f2f1
    style L7 fill:#fff9c4

第1層：ブラウザキャッシュ

概要

ブラウザキャッシュ は、ユーザーのブラウザに保存されるキャッシュです。

最もユーザーに近い ため、ヒットすれば ネットワーク通信すら発生しない 最速のキャッシュです。

制御方法：HTTPヘッダー

    # レスポンスヘッダーでキャッシュを制御
Cache-Control: max-age=3600        # 1時間キャッシュ
Cache-Control: no-cache            # 毎回サーバーに確認
Cache-Control: no-store            # キャッシュしない
Cache-Control: private             # ブラウザのみ（CDNはNG）
Cache-Control: public              # CDNもOK

実践的な設定例

    # Nginx設定例

# 静的ファイル（CSS, JS, 画像）→ 長期キャッシュ
location ~* \.(css|js|png|jpg|gif|ico|woff2)$ {
    expires 1y;
    add_header Cache-Control "public, immutable";
}

# HTML → 短期キャッシュ or キャッシュなし
location ~* \.html$ {
    expires 5m;
    add_header Cache-Control "no-cache";
}

# API → キャッシュしない
location /api/ {
    add_header Cache-Control "no-store";
}

ETagとLast-Modified

    # サーバーレスポンス
ETag: "abc123"
Last-Modified: Wed, 13 Dec 2025 10:00:00 GMT

# クライアントの次のリクエスト
If-None-Match: "abc123"
If-Modified-Since: Wed, 13 Dec 2025 10:00:00 GMT

# 変更がなければ 304 Not Modified を返す（本文なし = 高速）

キャッシュバスティング

ファイルを更新したのに、ブラウザが古いキャッシュを使い続ける問題の解決策：

    <!-- ファイル名にハッシュを含める -->
<link rel="stylesheet" href="/css/style.a1b2c3d4.css">
<script src="/js/app.e5f6g7h8.js"></script>

ビルドツール（Webpack, Vite）が自動でハッシュを付与してくれます。

第2層：CDNキャッシュ

概要

CDN（Content Delivery Network） は、世界中に分散配置されたサーバーにコンテンツをキャッシュします。

    【CDNなし】
日本のユーザー → 米国のオリジンサーバー（遅い）

【CDNあり】
日本のユーザー → 日本のCDNエッジ → 米国のオリジン
                 ↓
              キャッシュヒットなら
              ここで返す（速い）

主要なCDNサービス

サービス	特徴
CloudFlare	無料プランあり、WAF付き
AWS CloudFront	AWS連携が容易
Fastly	リアルタイム設定変更、VCL
Akamai	最大規模、エンタープライズ向け

CDNのキャッシュ制御

    # オリジンサーバーからCDNへの指示
Cache-Control: public, max-age=3600, s-maxage=86400
#                                    ↑ CDN用（1日）

ディレクティブ	意味
`s-maxage`	共有キャッシュ（CDN）用のTTL
`max-age`	ブラウザ用のTTL
`stale-while-revalidate`	古いキャッシュを返しつつ裏で更新
`stale-if-error`	オリジン障害時に古いキャッシュを返す

Surrogate-Key（タグベース無効化）

    # レスポンスにタグを付ける
Surrogate-Key: product-123 category-electronics

# 特定のタグだけ無効化（Fastlyの例）
curl -X POST "https://api.fastly.com/service/{id}/purge/product-123"

これにより、商品ID=123のキャッシュだけを選択的に削除できます。

CDNを使うべきケース

ユースケース	CDNの効果
画像・動画配信	◎ 非常に効果的
静的HTML/CSS/JS	◎ 非常に効果的
APIレスポンス	△ 慎重に設計
ユーザー固有データ	× 使わない

第3層：リバースプロキシキャッシュ

概要

リバースプロキシ は、アプリケーションサーバーの前段に配置され、レスポンスをキャッシュします。

構成図

    graph LR
    User[ユーザー]
    Proxy[Nginx/Varnish<br/>リバースプロキシ]
    Cache[(プロキシ<br/>キャッシュ)]
    App[アプリサーバー<br/>Node.js/Python/Ruby]
    DB[(データベース<br/>PostgreSQL/MySQL)]

    User -->|リクエスト| Proxy
    Proxy -->|1. キャッシュ確認| Cache
    Cache -->|ヒット| Proxy
    Cache -.->|ミス| App
    Proxy -.->|2. バックエンドへ| App
    App -.->|3. DB問い合わせ| DB
    DB -.->|4. データ| App
    App -.->|5. レスポンス| Proxy
    Proxy -->|6. キャッシュ保存| Cache
    Proxy -->|レスポンス| User

    style Proxy fill:#4caf50,stroke:#2e7d32,color:#fff
    style Cache fill:#ffeb3b,stroke:#f57f17
    style App fill:#2196f3,stroke:#1565c0,color:#fff
    style DB fill:#9c27b0,stroke:#6a1b9a,color:#fff
    style User fill:#e0e0e0,stroke:#616161

キャッシュヒット時: ユーザー → プロキシ → キャッシュ → ユーザー（超高速） キャッシュミス時: ユーザー → プロキシ → アプリ → DB → アプリ → プロキシ → キャッシュ保存 → ユーザー

Nginxのプロキシキャッシュ

    # キャッシュ領域の定義
proxy_cache_path /var/cache/nginx
    levels=1:2
    keys_zone=my_cache:10m
    max_size=10g
    inactive=60m
    use_temp_path=off;

server {
    location / {
        proxy_cache my_cache;
        proxy_cache_valid 200 1h;      # 200 OK は1時間
        proxy_cache_valid 404 1m;      # 404 は1分
        proxy_cache_use_stale error timeout updating;
        proxy_cache_lock on;           # 同時リクエストを1つに

        add_header X-Cache-Status $upstream_cache_status;

        proxy_pass http://backend;
    }
}

キャッシュステータスの確認

    # レスポンスヘッダーを確認
curl -I https://example.com/api/data

# X-Cache-Status の値
# HIT      → キャッシュから返した
# MISS     → キャッシュなし、オリジンから取得
# EXPIRED  → 期限切れ、オリジンから再取得
# STALE    → 古いキャッシュを返した
# UPDATING → 更新中に古いキャッシュを返した

Varnish（専用キャッシュサーバー）

Varnishは キャッシュに特化 したリバースプロキシです。

    # VCL（Varnish Configuration Language）
sub vcl_recv {
    # ログインユーザーはキャッシュしない
    if (req.http.Cookie ~ "session_id") {
        return (pass);
    }

    # APIはキャッシュしない
    if (req.url ~ "^/api/") {
        return (pass);
    }
}

sub vcl_backend_response {
    # 画像は1日キャッシュ
    if (bereq.url ~ "\.(png|jpg|gif)$") {
        set beresp.ttl = 1d;
    }
}

第4層：アプリケーションキャッシュ

概要

アプリケーションキャッシュ は、アプリケーションコード内で明示的に管理するキャッシュです。

代表的なツール：

Redis: 高機能、データ構造が豊富
Memcached: シンプル、高速

RedisとMemcachedの比較

項目	Redis	Memcached
データ構造	豊富（String, Hash, List, Set, Sorted Set）	String のみ
永続化	あり（RDB, AOF）	なし
レプリケーション	あり	なし
クラスタ	あり	なし（クライアント側で分散）
メモリ効率	低め	高め
用途	汎用	純粋なキャッシュ

Redisの基本操作

    # 接続
redis-cli

# 基本的なキャッシュ操作
SET user:1234 '{"name":"John","age":30}' EX 3600  # 1時間で期限切れ
GET user:1234
DEL user:1234

# 存在しない場合のみセット（ロックに使える）
SETNX lock:resource "1"

# TTL確認
TTL user:1234  # 残り秒数を返す

Pythonでの使用例

    import redis
import json

r = redis.Redis(host='localhost', port=6379, db=0)

def get_user(user_id: int) -> dict:
    # キャッシュキーを定義
    cache_key = f"user:{user_id}"

    # キャッシュから取得を試みる
    cached = r.get(cache_key)
    if cached:
        return json.loads(cached)

    # キャッシュミス → DBから取得
    user = db.query(User).filter(User.id == user_id).first()

    # キャッシュに保存（1時間）
    r.setex(cache_key, 3600, json.dumps(user.to_dict()))

    return user.to_dict()

def update_user(user_id: int, data: dict):
    # DBを更新
    db.query(User).filter(User.id == user_id).update(data)
    db.commit()

    # キャッシュを削除（次回アクセス時に再生成される）
    r.delete(f"user:{user_id}")

キャッシュキーの設計

    # 悪い例
cache_key = "user_data"  # 誰のデータ？

# 良い例
cache_key = f"user:{user_id}:profile"  # 明確

# 名前空間を使う
cache_key = f"v1:users:{user_id}:profile"
#            ↑ バージョン（スキーマ変更時に便利）

第5層：ORMキャッシュ

概要

ORM（Object-Relational Mapping）レベルで、クエリ結果やエンティティをキャッシュします。

Django ORMのキャッシュ

    from django.core.cache import cache

# クエリキャッシュ
def get_active_products():
    cache_key = "products:active"
    products = cache.get(cache_key)

    if products is None:
        products = list(Product.objects.filter(is_active=True))
        cache.set(cache_key, products, timeout=300)

    return products

# django-cacheopsを使う場合
from cacheops import cached

@cached(timeout=60*15)
def get_product(product_id):
    return Product.objects.get(id=product_id)

SQLAlchemyのキャッシュ

    from dogpile.cache import make_region

region = make_region().configure(
    'dogpile.cache.redis',
    arguments={
        'host': 'localhost',
        'port': 6379,
        'db': 0,
    }
)

@region.cache_on_arguments(expiration_time=3600)
def get_user_orders(user_id: int):
    return session.query(Order).filter(Order.user_id == user_id).all()

N+1問題とキャッシュ

    # 悪い例：N+1問題
for user in users:
    print(user.profile.bio)  # ユーザーごとにクエリが発生

# 良い例：Eager Loading
users = User.objects.select_related('profile').all()
for user in users:
    print(user.profile.bio)  # 追加クエリなし

キャッシュを入れる前に、まず N+1問題を解決 することが重要です。

第6層：データベースキャッシュ

概要

データベース自体が内部でキャッシュを持っています。

MySQLのバッファプール

    -- バッファプールのサイズ確認
SHOW VARIABLES LIKE 'innodb_buffer_pool_size';

-- バッファプールの使用状況
SHOW STATUS LIKE 'Innodb_buffer_pool%';

    +---------------------------------------+-------------+
| Variable_name                         | Value       |
+---------------------------------------+-------------+
| Innodb_buffer_pool_read_requests      | 123456789   | ← キャッシュから読んだ回数
| Innodb_buffer_pool_reads              | 12345       | ← ディスクから読んだ回数
+---------------------------------------+-------------+

ヒット率の計算：

    ヒット率 = 1 - (reads / read_requests)
         = 1 - (12345 / 123456789)
         = 99.99%

PostgreSQLの共有バッファ

    -- 設定確認
SHOW shared_buffers;

-- キャッシュヒット率
SELECT
    sum(blks_hit) / (sum(blks_hit) + sum(blks_read)) AS cache_hit_ratio
FROM pg_stat_database;

クエリキャッシュ（MySQL 5.7以前）

    -- ※ MySQL 8.0では廃止されました
SHOW VARIABLES LIKE 'query_cache%';

MySQL 8.0でクエリキャッシュが廃止された理由：

マルチコア環境でのスケーラビリティ問題
テーブル更新時のキャッシュ無効化オーバーヘッド
アプリケーション層でのキャッシュの方が効率的

第7層：ハードウェアキャッシュ

CPUキャッシュ（L1/L2/L3）

    graph TB
    subgraph CPU["CPU（マルチコアプロセッサ）"]
        subgraph Core0["Core 0"]
            L1_0["L1 Cache<br/>32KB<br/>~1ns"]
            L2_0["L2 Cache<br/>256KB<br/>~4ns"]
            L1_0 --> L2_0
        end

        subgraph Core1["Core 1"]
            L1_1["L1 Cache<br/>32KB<br/>~1ns"]
            L2_1["L2 Cache<br/>256KB<br/>~4ns"]
            L1_1 --> L2_1
        end

        subgraph Core2["Core 2"]
            L1_2["L1 Cache<br/>32KB<br/>~1ns"]
            L2_2["L2 Cache<br/>256KB<br/>~4ns"]
            L1_2 --> L2_2
        end

        L3["L3 Cache（共有）<br/>8MB<br/>~12ns"]

        L2_0 --> L3
        L2_1 --> L3
        L2_2 --> L3
    end

    Memory["メインメモリ<br/>32GB<br/>~100ns"]
    SSD["SSD<br/>1TB<br/>~100μs"]
    HDD["HDD<br/>4TB<br/>~10ms"]

    L3 --> Memory
    Memory --> SSD
    SSD --> HDD

    style CPU fill:#e3f2fd,stroke:#1976d2
    style Core0 fill:#fff3e0,stroke:#f57c00
    style Core1 fill:#fff3e0,stroke:#f57c00
    style Core2 fill:#fff3e0,stroke:#f57c00
    style L1_0 fill:#c8e6c9,stroke:#388e3c
    style L1_1 fill:#c8e6c9,stroke:#388e3c
    style L1_2 fill:#c8e6c9,stroke:#388e3c
    style L2_0 fill:#b2dfdb,stroke:#00796b
    style L2_1 fill:#b2dfdb,stroke:#00796b
    style L2_2 fill:#b2dfdb,stroke:#00796b
    style L3 fill:#b2ebf2,stroke:#0097a7
    style Memory fill:#e1bee7,stroke:#7b1fa2
    style SSD fill:#f8bbd0,stroke:#c2185b
    style HDD fill:#ffccbc,stroke:#d84315

階層構造の特徴：

L1/L2キャッシュ: コアごとに専有（高速だが小容量）
L3キャッシュ: 全コアで共有（L1/L2より大容量）
速度差: L1とHDDで1000万倍の差

レベル	サイズ	レイテンシ
L1	32KB	~1ns
L2	256KB	~4ns
L3	8MB	~12ns
メモリ	32GB	~100ns
SSD	1TB	~100μs
HDD	4TB	~10ms

100万倍の差 があることを意識しましょう。

    // 悪い例：False Sharing
struct Counter {
    int count1;  // Core 0 が更新
    int count2;  // Core 1 が更新
};
// 同じキャッシュライン(64B)に入るとお互いを無効化しあう

// 良い例：パディングで分離
struct Counter {
    int count1;
    char padding[60];  // 64バイト境界に揃える
    int count2;
};

ディスクキャッシュ

    # Linux のページキャッシュ確認
free -h
#               total   used   free  shared  buff/cache  available
# Mem:           31Gi   8.0Gi  12Gi   256Mi       11Gi       22Gi
#                                              ↑ ディスクキャッシュ

# ページキャッシュをクリア（検証用）
sync; echo 3 > /proc/sys/vm/drop_caches

4つのキャッシュパターン

キャッシュの実装方法には、主に4つのパターンがあります。用途に応じて使い分けることが重要です。

パターン全体像（縦並び比較）

    graph TB
    Title["4つのキャッシュパターン比較"]

    subgraph Pattern1["① Cache-Aside（最も一般的）"]
        CA_App[アプリ] -->|1. 確認| CA_Cache[キャッシュ]
        CA_Cache -->|2. ミス| CA_App
        CA_App -->|3. 取得| CA_DB[(DB)]
        CA_DB -->|4. 返却| CA_App
        CA_App -->|5. 保存| CA_Cache

        CA_Note["特徴: アプリが全て制御<br/>整合性: △<br/>用途: 最も一般的"]
    end

    subgraph Pattern2["② Read-Through（キャッシュが代行）"]
        RT_App[アプリ] -->|1. リクエスト| RT_Cache[キャッシュ]
        RT_Cache -->|2. ミス時自動取得| RT_DB[(DB)]
        RT_DB -->|3. 取得| RT_Cache
        RT_Cache -->|4. 返却| RT_App

        RT_Note["特徴: キャッシュが自動でDB取得<br/>整合性: ○<br/>用途: 読み取り専用"]
    end

    subgraph Pattern3["③ Write-Through（同期的書き込み）"]
        WT_App[アプリ] -->|1. 書込| WT_Cache[キャッシュ]
        WT_Cache -->|2. 同期書込| WT_DB[(DB)]
        WT_DB -->|3. 完了| WT_Cache
        WT_Cache -->|4. 完了| WT_App

        WT_Note["特徴: キャッシュとDB同時更新<br/>整合性: ◎<br/>用途: 強い整合性が必要"]
    end

    subgraph Pattern4["④ Write-Back（非同期書き込み）"]
        WB_App[アプリ] -->|1. 書込| WB_Cache[キャッシュ]
        WB_Cache -->|2. 即完了| WB_App
        WB_Cache -.->|3. 非同期書込| WB_DB[(DB)]

        WB_Note["特徴: 非同期でDB更新<br/>整合性: △<br/>用途: 高速書き込み必須"]
    end

    Title -.-> Pattern1
    Pattern1 -.-> Pattern2
    Pattern2 -.-> Pattern3
    Pattern3 -.-> Pattern4

    style Title fill:#e3f2fd,stroke:#1976d2,stroke-width:3px
    style Pattern1 fill:#e1f5ff,stroke:#01579b
    style Pattern2 fill:#e8f5e9,stroke:#1b5e20
    style Pattern3 fill:#fff3e0,stroke:#e65100
    style Pattern4 fill:#fce4ec,stroke:#880e4f
    style CA_Note fill:#f0f4c3,stroke:#827717
    style RT_Note fill:#f0f4c3,stroke:#827717
    style WT_Note fill:#f0f4c3,stroke:#827717
    style WB_Note fill:#f0f4c3,stroke:#827717

パターン比較表

パターン	読み取り	書き込み	整合性	複雑さ	用途
Cache-Aside	アプリが制御	DB→キャッシュ削除	△	低	最も一般的
Read-Through	キャッシュが代行	N/A	○	中	読み取り専用
Write-Through	N/A	同期的	◎	中	強い整合性
Write-Back	N/A	非同期的	△	高	高速書き込み

① Cache-Aside（最も一般的）

アプリケーションがキャッシュの読み書きを明示的に制御するパターン。最もシンプルで柔軟性が高い。

    flowchart LR
    App[アプリ]
    Cache[キャッシュ]
    DB[(DB)]

    App -->|1. 確認| Cache
    Cache -->|2. ミス| App
    App -->|3. 取得| DB
    DB -->|4. 返却| App
    App -->|5. 保存| Cache

    style App fill:#e1f5ff,stroke:#01579b
    style Cache fill:#fff3e0,stroke:#f57c00
    style DB fill:#f3e5f5,stroke:#7b1fa2

特徴：

アプリが全てのフローを制御
キャッシュミス時のみDB読み取り
書き込み時はDBを更新してキャッシュを削除（または更新）

メリット：

実装がシンプル
キャッシュ障害時もDBから読める（フォールバック可能）

デメリット：

キャッシュとDBの不整合が起きやすい
アプリ側でキャッシュロジックを実装する必要がある

② Read-Through（キャッシュが代行）

キャッシュがDBアクセスを代行するパターン。アプリはキャッシュのみにアクセス。

    flowchart LR
    App[アプリ]
    Cache[キャッシュ<br/>レイヤー]
    DB[(DB)]

    App -->|1. リクエスト| Cache
    Cache -->|2. ミス時<br/>自動取得| DB
    DB -->|3. 取得| Cache
    Cache -->|4. 返却| App

    style App fill:#e8f5e9,stroke:#1b5e20
    style Cache fill:#fff3e0,stroke:#f57c00
    style DB fill:#f3e5f5,stroke:#7b1fa2

特徴：

アプリはキャッシュとしか通信しない
キャッシュミス時、キャッシュレイヤーが自動的にDBから取得
キャッシュに取得ロジックが組み込まれている

メリット：

アプリのコードがシンプル
キャッシュロジックの一元管理

デメリット：

キャッシュレイヤーの実装が複雑
キャッシュ障害時にDBに直接アクセスできない

③ Write-Through（同期的書き込み）

キャッシュとDBの両方に同期的に書き込むパターン。強い整合性が保証される。

    flowchart LR
    App[アプリ]
    Cache[キャッシュ]
    DB[(DB)]

    App -->|1. 書込| Cache
    Cache -->|2. 同期書込| DB
    DB -->|3. 完了| Cache
    Cache -->|4. 完了| App

    style App fill:#fff3e0,stroke:#e65100
    style Cache fill:#fff3e0,stroke:#f57c00
    style DB fill:#f3e5f5,stroke:#7b1fa2

特徴：

キャッシュとDBが常に同期
書き込み完了はDB書き込み完了後
キャッシュとDBの整合性が保証される

メリット：

データの整合性が高い
キャッシュが常に最新

デメリット：

書き込みが遅い（DBの速度に依存）
DBへの負荷が高い

④ Write-Back（非同期書き込み）

キャッシュに書き込んだ後、非同期的にDBに反映するパターン。高速書き込みが可能。

    flowchart LR
    App[アプリ]
    Cache[キャッシュ]
    DB[(DB)]

    App -->|1. 書込| Cache
    Cache -->|2. 即座に完了| App
    Cache -.->|3. 非同期<br/>バッチ書込| DB

    style App fill:#fce4ec,stroke:#880e4f
    style Cache fill:#fff3e0,stroke:#f57c00
    style DB fill:#f3e5f5,stroke:#7b1fa2

特徴：

キャッシュに書き込んだら即座に完了
DBへの書き込みは後で非同期的に実行
書き込みバッファとして機能

メリット：

書き込みが非常に高速
DBへの書き込みをバッチ化できる（効率的）

デメリット：

キャッシュ障害時にデータロスの可能性
整合性の保証が弱い
実装が複雑

1. Cache-Aside（Lazy Loading）

最も一般的なパターン。アプリケーションがキャッシュを管理します。

処理フロー

    sequenceDiagram
    participant App as アプリケーション
    participant Cache as キャッシュ
    participant DB as データベース

    Note over App,DB: 【読み取り（Cache Hit）】
    App->>Cache: 1. GET key
    Cache-->>App: 2. データ返却（ヒット）

    Note over App,DB: 【読み取り（Cache Miss）】
    App->>Cache: 1. GET key
    Cache-->>App: 2. NULL（ミス）
    App->>DB: 3. SELECT
    DB-->>App: 4. データ返却
    App->>Cache: 5. SET key, TTL
    Cache-->>App: 6. OK

    Note over App,DB: 【書き込み】
    App->>DB: 1. UPDATE
    DB-->>App: 2. OK
    App->>Cache: 3. DELETE key
    Cache-->>App: 4. OK

設計ポイント：

書き込み時はキャッシュ削除（更新ではない）が基本
- 理由：更新だとレースコンディションで古いデータが残る可能性
次回読み取り時に最新データがキャッシュされる（Lazy Loading）

    def get_user(user_id):
    # 1. キャッシュを確認
    cached = cache.get(f"user:{user_id}")
    if cached:
        return cached  # 2. あれば返す

    # 3. なければDBから取得
    user = db.query(User).get(user_id)
    cache.set(f"user:{user_id}", user, ttl=3600)
    return user

def update_user(user_id, data):
    # 1. DBを更新
    db.query(User).filter(id=user_id).update(data)
    # 2. キャッシュを削除
    cache.delete(f"user:{user_id}")

メリット：

シンプル
必要なデータだけキャッシュされる

デメリット：

キャッシュミス時にレイテンシが増加
データの不整合リスク

2. Write-Through

書き込み時に、DBとキャッシュを同時に更新します。

処理フロー

    sequenceDiagram
    participant App as アプリケーション
    participant Cache as キャッシュ
    participant DB as データベース

    Note over App,DB: 【書き込み（同期的）】
    App->>Cache: 1. SET key, value
    Cache-->>App: 2. OK
    Cache->>DB: 3. UPDATE（同期）
    DB-->>Cache: 4. OK
    Cache-->>App: 5. 書き込み完了

    Note over App,DB: 【読み取り（常にヒット）】
    App->>Cache: 1. GET key
    Cache-->>App: 2. データ返却（常に最新）

設計ポイント：

キャッシュとDBの整合性が常に保たれる
書き込みがDBの速度に律速される（遅い）
トランザクション管理が重要

    def update_user(user_id, data):
    # トランザクションで整合性を保証
    try:
        db.begin()
        db.query(User).filter(id=user_id).update(data)
        cache.set(f"user:{user_id}", data, ttl=3600)
        db.commit()
    except:
        db.rollback()
        cache.delete(f"user:{user_id}")
        raise

メリット：

データの整合性が高い
読み取りが常に高速

デメリット：

書き込みが遅い
使われないデータもキャッシュされる

3. Write-Behind（Write-Back）

書き込みをキャッシュに行い、DBへは非同期で反映します。

処理フロー

    sequenceDiagram
    participant App as アプリケーション
    participant Cache as キャッシュ
    participant Queue as 書込キュー
    participant Worker as バックグラウンドWorker
    participant DB as データベース

    Note over App,DB: 【書き込み（非同期）】
    App->>Cache: 1. SET key, value
    Cache-->>App: 2. OK（即座に完了）
    Cache->>Queue: 3. キューに追加

    Note over App,DB: 【バックグラウンド処理】
    Worker->>Queue: 定期的にチェック
    Queue-->>Worker: 書込データ取得
    Worker->>DB: UPDATE
    DB-->>Worker: OK

    Note over App,DB: 【読み取り】
    App->>Cache: GET key
    Cache-->>App: 最新データ返却

設計ポイント：

書き込みが超高速（キャッシュ速度）
キャッシュクラッシュ時にデータロスリスク
DBへの書き込みをバッチ化できる（効率的）

    import asyncio
from collections import deque

write_queue = deque()

def update_user(user_id, data):
    # キャッシュを即座に更新
    cache.set(f"user:{user_id}", data)
    # 書き込みキューに追加
    write_queue.append(("user", user_id, data))

async def background_writer():
    while True:
        if write_queue:
            table, id, data = write_queue.popleft()
            await db.async_update(table, id, data)
        await asyncio.sleep(0.1)

メリット：

書き込みが非常に高速
DBへの書き込みをバッチ化できる

デメリット：

データロスのリスク（キャッシュがクラッシュすると）
複雑な実装

4. Read-Through

キャッシュがDBからの読み取りを代行します。

処理フロー

    sequenceDiagram
    participant App as アプリケーション
    participant Cache as キャッシュ（loader付き）
    participant DB as データベース

    Note over App,DB: 【読み取り（Cache Hit）】
    App->>Cache: GET key
    Cache-->>App: データ返却

    Note over App,DB: 【読み取り（Cache Miss）】
    App->>Cache: GET key
    Note over Cache: キャッシュミス検知
    Cache->>DB: SELECT（自動）
    DB-->>Cache: データ返却
    Note over Cache: 自動でキャッシュに保存
    Cache-->>App: データ返却

Cache-Asideとの違い：

項目	Cache-Aside	Read-Through
DB取得ロジック	アプリが実装	キャッシュが実装
キャッシュミス時	アプリが明示的にDBアクセス	キャッシュが自動でDBアクセス
実装場所	アプリケーション層	キャッシュ層
柔軟性	高い	低い

    class ReadThroughCache:
    def __init__(self, loader_func):
        self.cache = {}
        self.loader = loader_func

    def get(self, key):
        if key not in self.cache:
            self.cache[key] = self.loader(key)
        return self.cache[key]

# 使用例
cache = ReadThroughCache(loader_func=lambda k: db.get_user(k))
user = cache.get("user:1234")

TTL（Time To Live）の設計

キャッシュエビクション戦略

キャッシュが満杯になったとき、どのデータを削除するかの戦略です。

    graph TB
    subgraph TTL["TTL（Time To Live）"]
        TTL_Start[キャッシュ保存]
        TTL_Time[時間経過]
        TTL_Expire[期限切れ]
        TTL_Delete[自動削除]

        TTL_Start --> TTL_Time
        TTL_Time --> TTL_Expire
        TTL_Expire --> TTL_Delete
    end

    subgraph LRU["LRU（Least Recently Used）"]
        LRU_Cache["キャッシュ: A→B→C→D"]
        LRU_Access[Bにアクセス]
        LRU_Move["B→C→D→A"]
        LRU_Full[満杯時]
        LRU_Evict[先頭Aを削除]

        LRU_Cache --> LRU_Access
        LRU_Access --> LRU_Move
        LRU_Move --> LRU_Full
        LRU_Full --> LRU_Evict
    end

    subgraph LFU["LFU（Least Frequently Used）"]
        LFU_Track["アクセス回数を記録<br/>A:10回 B:5回 C:3回 D:1回"]
        LFU_Full[満杯時]
        LFU_Evict["最少回数Dを削除"]

        LFU_Track --> LFU_Full
        LFU_Full --> LFU_Evict
    end

    style TTL fill:#e1f5ff,stroke:#01579b
    style LRU fill:#e8f5e9,stroke:#1b5e20
    style LFU fill:#fff3e0,stroke:#e65100

戦略	削除対象	メリット	デメリット	用途
TTL	期限切れ	シンプル	古くても使われるデータも削除	一般的
LRU	最も古くアクセス	バランス良い	実装がやや複雑	Redis default
LFU	最も使用頻度低い	人気データを保持	新規データが削除されやすい	特殊用途
FIFO	最も古く追加	実装簡単	アクセス頻度無視	非推奨

TTLの決め方

    # TTLの決め方
TTL = min(
    データの変更頻度に基づく時間,
    ビジネス要件上許容できる遅延,
    メモリ制約から逆算した時間
)

用途別のTTL目安

データ種別	TTL	理由
セッション	30分〜24時間	セキュリティとUXのバランス
ユーザープロフィール	5分〜1時間	頻繁には変わらない
商品情報	1分〜5分	在庫・価格は変動する
検索結果	30秒〜5分	鮮度が重要
設定・マスターデータ	1時間〜1日	ほぼ変わらない
静的コンテンツ	1日〜1年	変更時はキャッシュバスト

TTLにジッターを入れる

    import random

def get_ttl_with_jitter(base_ttl: int) -> int:
    """TTLにランダムな揺らぎを加える"""
    jitter = random.uniform(-0.1, 0.1)  # ±10%
    return int(base_ttl * (1 + jitter))

# 使用例
cache.set("key", value, ttl=get_ttl_with_jitter(3600))
# 3240〜3960秒のランダムなTTL

これにより、キャッシュ雪崩 を防げます。

キャッシュの無効化

“There are only two hard things in Computer Science: cache invalidation and naming things.” — Phil Karlton

無効化の戦略

戦略	説明	使いどころ
TTL	時間経過で自動削除	多くのケース
イベント駆動	更新時に明示的に削除	整合性が重要
バージョニング	キーにバージョンを含める	スキーマ変更時
タグベース	タグで関連キャッシュを一括削除	複雑な依存関係

イベント駆動の無効化

    # 商品更新時に関連キャッシュを全て削除
def update_product(product_id, data):
    db.update_product(product_id, data)

    # 関連するキャッシュを全て削除
    cache.delete(f"product:{product_id}")
    cache.delete(f"product:{product_id}:detail")
    cache.delete(f"category:{product.category_id}:products")
    cache.delete("products:featured")
    cache.delete("products:bestsellers")

バージョニング

    CACHE_VERSION = "v3"  # スキーマ変更時にインクリメント

def cache_key(key: str) -> str:
    return f"{CACHE_VERSION}:{key}"

# 使用例
cache.set(cache_key("user:1234"), user_data)

古いバージョンのキャッシュは自然にTTLで消えていきます。

キャッシュの問題と対策

1. キャッシュスタンペード（Thundering Herd）

問題： キャッシュが切れた瞬間に、大量のリクエストが同時にDBに殺到する

問題の可視化

    graph TB
    subgraph Problem["❌ 問題：スタンピード発生"]
        P_Time[TTL期限切れ]
        P_R1[Request 1]
        P_R2[Request 2]
        P_R3[Request 3]
        P_Cache1[キャッシュ<br/>ミス]
        P_Cache2[キャッシュ<br/>ミス]
        P_Cache3[キャッシュ<br/>ミス]
        P_DB[(DB)]

        P_Time --> P_R1 & P_R2 & P_R3
        P_R1 --> P_Cache1 --> P_DB
        P_R2 --> P_Cache2 --> P_DB
        P_R3 --> P_Cache3 --> P_DB
    end

    subgraph Solution["✅ 対策：ロック使用"]
        S_Time[TTL期限切れ]
        S_R1[Request 1]
        S_R2[Request 2]
        S_R3[Request 3]
        S_Lock{ロック取得}
        S_DB[(DB)]
        S_Wait[待機]
        S_Cache[キャッシュ更新]

        S_Time --> S_R1 & S_R2 & S_R3
        S_R1 --> S_Lock
        S_R2 --> S_Lock
        S_R3 --> S_Lock
        S_Lock -->|成功| S_DB
        S_Lock -->|失敗| S_Wait
        S_DB --> S_Cache
        S_Cache --> S_Wait
    end

    style Problem fill:#ffebee,stroke:#c62828
    style Solution fill:#e8f5e9,stroke:#2e7d32
    style P_DB fill:#ff5252,color:#fff
    style S_DB fill:#4caf50,color:#fff

対策1：ロック

    import time

def get_with_lock(key: str):
    value = cache.get(key)
    if value:
        return value

    lock_key = f"lock:{key}"

    # ロックを取得（最初の1リクエストだけ）
    if cache.setnx(lock_key, "1", ex=10):
        try:
            value = db.get(key)
            cache.set(key, value, ttl=3600)
            return value
        finally:
            cache.delete(lock_key)
    else:
        # ロックを取れなかったら少し待ってリトライ
        time.sleep(0.1)
        return get_with_lock(key)

対策2：確率的早期再計算（Probabilistic Early Recomputation）

    import random
import math

def get_with_early_recompute(key: str, beta: float = 1.0):
    value, expiry = cache.get_with_expiry(key)

    if value is None:
        return recompute_and_cache(key)

    now = time.time()
    ttl = expiry - now

    # 期限が近づくにつれ、再計算の確率が上がる
    # delta = 計算にかかる時間
    delta = 0.1  # 100ms

    if ttl - delta * beta * math.log(random.random()) <= 0:
        return recompute_and_cache(key)

    return value

2. キャッシュペネトレーション

問題： 存在しないキーへのリクエストが毎回DBに到達する

問題と対策の可視化

    graph TB
    subgraph Attack["❌ 攻撃：存在しないIDで攻撃"]
        A_Req1[GET /user/999999]
        A_Req2[GET /user/888888]
        A_Req3[GET /user/777777]
        A_Cache[キャッシュ<br/>全てミス]
        A_DB[(DB<br/>全てNULL)]

        A_Req1 --> A_Cache
        A_Req2 --> A_Cache
        A_Req3 --> A_Cache
        A_Cache --> A_DB
    end

    subgraph Defense1["✅ 対策1：ネガティブキャッシュ"]
        D1_Req[GET /user/999999]
        D1_Cache{キャッシュ確認}
        D1_Null["NULL<br/>をキャッシュ"]
        D1_Return[NULL返却]

        D1_Req --> D1_Cache
        D1_Cache -->|ヒット| D1_Return
        D1_Cache -->|ミス| D1_Null
        D1_Null --> D1_Return
    end

    subgraph Defense2["✅ 対策2：Bloom Filter"]
        D2_Req[GET /user/123]
        D2_Bloom{Bloom Filter<br/>存在チェック}
        D2_Return[即座にNULL]
        D2_Cache[キャッシュ確認]

        D2_Req --> D2_Bloom
        D2_Bloom -->|存在しない| D2_Return
        D2_Bloom -->|存在する可能性| D2_Cache
    end

    style Attack fill:#ffebee,stroke:#c62828
    style Defense1 fill:#e8f5e9,stroke:#2e7d32
    style Defense2 fill:#e1f5fe,stroke:#0277bd
    style A_DB fill:#ff5252,color:#fff

攻撃例：

    # 悪者がランダムなIDでリクエスト
GET /user/999999999  # 存在しない → 毎回DB

# 攻撃例
for i in range(1000000):
    requests.get(f"/user/{random.randint(1, 999999999)}")

対策1：ネガティブキャッシュ

    def get_user(user_id):
    cached = cache.get(f"user:{user_id}")
    if cached == "NULL":  # 存在しないことをキャッシュ
        return None
    if cached:
        return cached

    user = db.get_user(user_id)
    if user is None:
        cache.set(f"user:{user_id}", "NULL", ttl=60)  # 短めのTTL
        return None

    cache.set(f"user:{user_id}", user, ttl=3600)
    return user

対策2：Bloom Filter

    from pybloom_live import BloomFilter

# 起動時に全ユーザーIDでBloom Filterを初期化
user_bloom = BloomFilter(capacity=1000000, error_rate=0.001)
for user_id in db.get_all_user_ids():
    user_bloom.add(user_id)

def get_user(user_id):
    # Bloom Filterでチェック（高速）
    if user_id not in user_bloom:
        return None  # 確実に存在しない

    # 以降は通常のキャッシュロジック
    cached = cache.get(f"user:{user_id}")
    ...

3. キャッシュ雪崩（Cache Avalanche）

問題： 大量のキャッシュが同時に期限切れになり、DBに負荷が集中

問題と対策の可視化

    graph TB
    subgraph Problem["❌ 問題：同時期限切れ"]
        P_T0[時刻 T0<br/>一斉キャッシュ保存<br/>TTL=3600s]
        P_T3600[時刻 T0+3600s<br/>一斉期限切れ]
        P_Burst[大量リクエスト<br/>一斉にDB直撃]
        P_DB[(DB<br/>過負荷)]

        P_T0 --> P_T3600
        P_T3600 --> P_Burst
        P_Burst --> P_DB
    end

    subgraph Solution["✅ 対策：TTLジッター"]
        S_T0[時刻 T0<br/>キャッシュ保存]
        S_TTL1[TTL=3300s]
        S_TTL2[TTL=3600s]
        S_TTL3[TTL=3900s]
        S_Spread[期限切れが分散]
        S_DB[(DB<br/>負荷分散)]

        S_T0 --> S_TTL1 & S_TTL2 & S_TTL3
        S_TTL1 & S_TTL2 & S_TTL3 --> S_Spread
        S_Spread --> S_DB
    end

    style Problem fill:#ffebee,stroke:#c62828
    style Solution fill:#e8f5e9,stroke:#2e7d32
    style P_DB fill:#ff5252,color:#fff
    style S_DB fill:#4caf50,color:#fff

対策：TTLにジッター（揺らぎ）を追加

    import random

# 全てのキャッシュが同時に切れないよう、TTLをばらけさせる
base_ttl = 3600
jitter = random.randint(-300, 300)  # ±5分（約±8%）
cache.set(key, value, ttl=base_ttl + jitter)

# 例：
# Key1: TTL=3300s（55分）
# Key2: TTL=3600s（60分）
# Key3: TTL=3900s（65分）
# → 期限切れが10分間に分散

4. ホットキー問題

問題： 特定のキーにアクセスが集中し、そのキーを持つノードがボトルネックに

問題と対策の可視化

    graph TB
    subgraph Problem["❌ 問題：ホットキー集中"]
        P_App1[App Server 1]
        P_App2[App Server 2]
        P_App3[App Server 3]
        P_Redis[Redis Node 1<br/>product:popular<br/>⚠️ 過負荷]
        P_Redis2[Redis Node 2<br/>アイドル]
        P_Redis3[Redis Node 3<br/>アイドル]

        P_App1 --> P_Redis
        P_App2 --> P_Redis
        P_App3 --> P_Redis
    end

    subgraph Solution["✅ 対策：多層キャッシュ"]
        S_App1[App Server 1]
        S_Local1[ローカル<br/>キャッシュ<br/>TTL=10s]
        S_Redis[Redis<br/>TTL=1h]
        S_DB[(DB)]

        S_App1 --> S_Local1
        S_Local1 -->|ミス| S_Redis
        S_Redis -->|ミス| S_DB
    end

    style Problem fill:#ffebee,stroke:#c62828
    style Solution fill:#e8f5e9,stroke:#2e7d32
    style P_Redis fill:#ff5252,color:#fff
    style S_Local1 fill:#4caf50,color:#fff

対策1：ローカルキャッシュの併用

    from cachetools import TTLCache

# アプリケーションプロセス内のキャッシュ
local_cache = TTLCache(maxsize=100, ttl=10)

def get_popular_product(product_id):
    # まずローカルキャッシュを確認
    if product_id in local_cache:
        return local_cache[product_id]

    # 次にRedis
    product = cache.get(f"product:{product_id}")
    if product:
        local_cache[product_id] = product  # ローカルにも保存
        return product

    # 最後にDB
    product = db.get_product(product_id)
    cache.set(f"product:{product_id}", product)
    local_cache[product_id] = product
    return product

対策2：レプリカからの読み取り

    # Redisのレプリカを使い分ける
import random

replicas = ["redis-replica-1", "redis-replica-2", "redis-replica-3"]

def get_from_replica(key):
    replica = random.choice(replicas)
    return redis.Redis(host=replica).get(key)

実践的なキャッシュ設計

ケース1：ECサイトの商品ページ

階層的なキャッシュで、データの特性に応じたTTLを設定します。

階層的キャッシュ構成

    graph TB
    User[ユーザー]
    Browser[ブラウザキャッシュ<br/>静的リソース<br/>TTL: 1年]
    CDN[CDN<br/>画像・CSS・JS<br/>TTL: 1日]
    Nginx[Nginx<br/>HTMLページ<br/>TTL: 5分]
    App[アプリケーション]
    Redis[Redis]

    subgraph Redis_Data["Redisキャッシュ層"]
        Product[商品基本情報<br/>TTL: 5分]
        Reviews[レビュー<br/>TTL: 10分]
        Related[関連商品<br/>TTL: 1時間]
        Inventory[在庫数<br/>TTL: 30秒]
    end

    DB[(PostgreSQL)]

    User --> Browser
    Browser -->|ミス| CDN
    CDN -->|ミス| Nginx
    Nginx -->|ミス| App
    App --> Product & Reviews & Related & Inventory
    Product & Reviews & Related & Inventory -->|ミス| DB

    style Browser fill:#e1f5ff
    style CDN fill:#e8f5e9
    style Nginx fill:#fff3e0
    style Redis_Data fill:#fce4ec
    style Inventory fill:#ffeb3b

TTL設計の根拠：

データ	TTL	理由
静的リソース	1年	ほぼ不変、バージョニングで管理
商品画像	1日	頻繁には変わらない
HTMLページ	5分	価格・在庫変更に対応
商品基本情報	5分	ある程度の遅延許容
レビュー	10分	リアルタイム性低い
関連商品	1時間	ほぼ変わらない
在庫数	30秒	最も鮮度が重要

実装例

    # 階層的なキャッシュ設計

# 1. ページ全体のHTMLキャッシュ（CDN + Nginx）
# Cache-Control: public, max-age=60, s-maxage=300

# 2. 商品データキャッシュ（Redis）
def get_product_page_data(product_id):
    return {
        "product": get_product(product_id),           # TTL: 5分
        "reviews": get_reviews(product_id),           # TTL: 10分
        "related": get_related_products(product_id),  # TTL: 1時間
        "inventory": get_inventory(product_id),       # TTL: 30秒
    }

# 3. 在庫はリアルタイム性が重要なので短いTTL
def get_inventory(product_id):
    key = f"inventory:{product_id}"
    cached = cache.get(key)
    if cached:
        return cached

    inventory = db.get_inventory(product_id)
    cache.set(key, inventory, ttl=30)
    return inventory

ケース2：ソーシャルメディアのタイムライン

    # ファンアウト・オン・リード vs ファンアウト・オン・ライト

# ファンアウト・オン・リード（読み取り時にマージ）
def get_timeline(user_id):
    following_ids = get_following(user_id)  # フォロー中のユーザー

    posts = []
    for following_id in following_ids:
        user_posts = cache.get(f"posts:{following_id}")
        posts.extend(user_posts or [])

    return sorted(posts, key=lambda x: x["created_at"], reverse=True)[:100]

# ファンアウト・オン・ライト（書き込み時に配信）
def create_post(user_id, content):
    post = db.create_post(user_id, content)

    # フォロワー全員のタイムラインキャッシュを更新
    follower_ids = get_followers(user_id)
    for follower_id in follower_ids:
        cache.lpush(f"timeline:{follower_id}", post)
        cache.ltrim(f"timeline:{follower_id}", 0, 99)  # 100件まで

ケース3：APIレート制限

    def rate_limit(user_id: str, limit: int = 100, window: int = 60) -> bool:
    """
    スライディングウィンドウでのレート制限
    """
    key = f"rate:{user_id}"
    now = time.time()

    pipe = redis.pipeline()

    # 古いエントリを削除
    pipe.zremrangebyscore(key, 0, now - window)

    # 現在のリクエストを追加
    pipe.zadd(key, {str(now): now})

    # カウント
    pipe.zcard(key)

    # TTL設定
    pipe.expire(key, window)

    results = pipe.execute()
    request_count = results[2]

    return request_count <= limit

監視とデバッグ

Redisの監視

    # リアルタイム統計
redis-cli info stats

# キーの統計
redis-cli info keyspace

# スロークエリログ
redis-cli slowlog get 10

# メモリ使用量
redis-cli info memory

# 特定キーのメモリ使用量
redis-cli memory usage "user:1234"

ヒット率の計算

    # Redisの統計から計算
info = redis.info("stats")
hits = info["keyspace_hits"]
misses = info["keyspace_misses"]
hit_rate = hits / (hits + misses) * 100
print(f"Cache hit rate: {hit_rate:.2f}%")

目標ヒット率の目安：

90%未満 → TTLやキャッシュ戦略を見直す
95%以上 → 良好
99%以上 → 優秀

キャッシュのデバッグ

    import logging

logger = logging.getLogger("cache")

def get_with_logging(key: str):
    value = cache.get(key)

    if value is None:
        logger.info(f"CACHE MISS: {key}")
    else:
        logger.debug(f"CACHE HIT: {key}")

    return value

キャッシュを入れる前に考えること

キャッシュ戦略選定フローチャート

    flowchart TD
    Start([キャッシュ導入検討])
    Q1{パフォーマンス<br/>問題あり？}
    Optimize[最適化実施<br/>インデックス追加<br/>N+1解消<br/>接続プール設定]

    Q2{データ種類は？}
    Static[静的コンテンツ<br/>画像/CSS/JS]
    Dynamic[動的コンテンツ<br/>頻繁に変わらない]
    UserSpec[ユーザー固有<br/>セッション/カート]

    L_CDN[CDN層<br/>CloudFlare<br/>CloudFront]
    L_Proxy[プロキシ層<br/>Nginx<br/>Varnish]
    L_App[アプリ層<br/>Redis<br/>Memcached]

    Q3{整合性要件？}
    Strong[強整合性<br/>金融/在庫]
    Eventual[結果整合性<br/>商品/レビュー]
    Speed[速度最優先<br/>ログ/分析]

    P_WT[Write-Through]
    P_CA[Cache-Aside]
    P_WB[Write-Back]

    Q4{TTL設定}
    TTL_S[短TTL: 30s-5m<br/>在庫/価格]
    TTL_M[中TTL: 5m-1h<br/>商品/ユーザー]
    TTL_L[長TTL: 1h-1d<br/>設定/マスタ]

    Monitor[監視設定<br/>ヒット率90%以上<br/>レスポンス監視<br/>メモリ使用率]

    Start --> Q1
    Q1 -->|No| Optimize
    Q1 -->|Yes| Q2
    Q2 --> Static --> L_CDN
    Q2 --> Dynamic --> L_Proxy
    Q2 --> UserSpec --> L_App
    L_CDN & L_Proxy & L_App --> Q3
    Q3 --> Strong --> P_WT
    Q3 --> Eventual --> P_CA
    Q3 --> Speed --> P_WB
    P_WT & P_CA & P_WB --> Q4
    Q4 --> TTL_S & TTL_M & TTL_L
    TTL_S & TTL_M & TTL_L --> Monitor

    style Start fill:#e3f2fd
    style Optimize fill:#fff3e0
    style L_CDN fill:#e8f5e9
    style L_Proxy fill:#e8f5e9
    style L_App fill:#e8f5e9
    style Monitor fill:#c8e6c9

チェックリスト

本当にキャッシュが必要か？
- まずはクエリの最適化（インデックス、N+1解消）
- コネクションプーリングの適切な設定
- 非同期処理への切り替え
どの層にキャッシュを入れるか？
- 静的コンテンツ → CDN
- 動的だが変更少ない → リバースプロキシ
- ユーザー固有 → アプリケーションキャッシュ
データの整合性要件は？
- 強い整合性 → Write-Through
- 結果整合性でOK → Cache-Aside
- 最速が必要 → Write-Behind
障害時の挙動は？
- キャッシュがダウンしたらどうなる？
- 古いデータを返すのはOK？

アンチパターン

アンチパターン	問題点
何でもキャッシュ	メモリ浪費、複雑化
永久キャッシュ	データが腐る
キャッシュ前提の設計	障害時に全滅
キーの設計なし	衝突、管理不能

まとめ

キャッシュの7層

層	場所	特徴
1	ブラウザ	最速、ユーザーごと
2	CDN	グローバル分散
3	リバースプロキシ	サーバー側で制御
4	アプリケーション	柔軟、明示的
5	ORM	自動化しやすい
6	データベース	透過的
7	ハードウェア	意識しにくい

4つのパターン

パターン	特徴	使いどころ
Cache-Aside	シンプル	一般的なケース
Write-Through	整合性重視	金融系など
Write-Behind	速度重視	ログ、分析系
Read-Through	抽象化	フレームワーク

心がけ

キャッシュは複雑さを増す — 必要な場所にだけ入れる
TTLは短めから始める — 問題が起きたら調整
監視を忘れない — ヒット率を常に見る
障害を想定する — キャッシュなしでも動くように

参考リンク

Redis公式ドキュメント
Varnish公式
CloudFlare Cache
Designing Data-Intensive Applications - Martin Kleppmann
System Design Primer - Caching

この記事の対象読者#

キャッシュとは何か？#

一言で言うと#

なぜキャッシュが必要なのか#

キャッシュの本質#

7つのキャッシュ層#

第1層：ブラウザキャッシュ#

概要#

制御方法：HTTPヘッダー#

実践的な設定例#

ETagとLast-Modified#

キャッシュバスティング#

第2層：CDNキャッシュ#

概要#

主要なCDNサービス#

CDNのキャッシュ制御#

Surrogate-Key（タグベース無効化）#

CDNを使うべきケース#

第3層：リバースプロキシキャッシュ#

概要#

構成図#

Nginxのプロキシキャッシュ#

キャッシュステータスの確認#

Varnish（専用キャッシュサーバー）#

第4層：アプリケーションキャッシュ#

概要#

RedisとMemcachedの比較#

Redisの基本操作#

Pythonでの使用例#

キャッシュキーの設計#

第5層：ORMキャッシュ#

概要#

Django ORMのキャッシュ#

SQLAlchemyのキャッシュ#

N+1問題とキャッシュ#

第6層：データベースキャッシュ#

概要#

MySQLのバッファプール#

PostgreSQLの共有バッファ#

クエリキャッシュ（MySQL 5.7以前）#

第7層：ハードウェアキャッシュ#

CPUキャッシュ（L1/L2/L3）#

キャッシュラインとFalse Sharing#

ディスクキャッシュ#

4つのキャッシュパターン#

パターン全体像（縦並び比較）#

パターン比較表#

① Cache-Aside（最も一般的）#

② Read-Through（キャッシュが代行）#

③ Write-Through（同期的書き込み）#

④ Write-Back（非同期書き込み）#

1. Cache-Aside（Lazy Loading）#

処理フロー#

2. Write-Through#

処理フロー#

3. Write-Behind（Write-Back）#

処理フロー#

4. Read-Through#

処理フロー#

TTL（Time To Live）の設計#

キャッシュエビクション戦略#

TTLの決め方#

用途別のTTL目安#

TTLにジッターを入れる#

キャッシュの無効化#

無効化の戦略#

イベント駆動の無効化#

バージョニング#

キャッシュの問題と対策#

1. キャッシュスタンペード（Thundering Herd）#

問題の可視化#

2. キャッシュペネトレーション#

問題と対策の可視化#

3. キャッシュ雪崩（Cache Avalanche）#

問題と対策の可視化#

4. ホットキー問題#

問題と対策の可視化#

実践的なキャッシュ設計#

ケース1：ECサイトの商品ページ#

階層的キャッシュ構成#

この記事の対象読者

キャッシュとは何か？

一言で言うと

なぜキャッシュが必要なのか

キャッシュの本質

7つのキャッシュ層

第1層：ブラウザキャッシュ

概要

制御方法：HTTPヘッダー

実践的な設定例

ETagとLast-Modified

キャッシュバスティング

第2層：CDNキャッシュ

概要

主要なCDNサービス

CDNのキャッシュ制御

Surrogate-Key（タグベース無効化）

CDNを使うべきケース

第3層：リバースプロキシキャッシュ

概要

構成図

Nginxのプロキシキャッシュ

キャッシュステータスの確認

Varnish（専用キャッシュサーバー）

第4層：アプリケーションキャッシュ

概要

RedisとMemcachedの比較

Redisの基本操作

Pythonでの使用例

キャッシュキーの設計

第5層：ORMキャッシュ

概要

Django ORMのキャッシュ

SQLAlchemyのキャッシュ

N+1問題とキャッシュ

第6層：データベースキャッシュ

概要

MySQLのバッファプール

PostgreSQLの共有バッファ

クエリキャッシュ（MySQL 5.7以前）

第7層：ハードウェアキャッシュ

CPUキャッシュ（L1/L2/L3）

キャッシュラインとFalse Sharing

ディスクキャッシュ

4つのキャッシュパターン

パターン全体像（縦並び比較）

パターン比較表

① Cache-Aside（最も一般的）

② Read-Through（キャッシュが代行）

③ Write-Through（同期的書き込み）

④ Write-Back（非同期書き込み）

1. Cache-Aside（Lazy Loading）

処理フロー

2. Write-Through

処理フロー

3. Write-Behind（Write-Back）

処理フロー

4. Read-Through

処理フロー

TTL（Time To Live）の設計

キャッシュエビクション戦略

TTLの決め方

用途別のTTL目安

TTLにジッターを入れる

キャッシュの無効化

無効化の戦略

イベント駆動の無効化

バージョニング

キャッシュの問題と対策

1. キャッシュスタンペード（Thundering Herd）

問題の可視化

2. キャッシュペネトレーション

問題と対策の可視化

3. キャッシュ雪崩（Cache Avalanche）

問題と対策の可視化

4. ホットキー問題

問題と対策の可視化

実践的なキャッシュ設計

ケース1：ECサイトの商品ページ

階層的キャッシュ構成