「ローカルでは動いた」が消えた日｜Docker Compose V2 + BuildKitをチームで1年使って分かったこと

「ローカルでは動いた」が消えた日から1年

去年の春、チームの新メンバーが「自分のMacでだけビルドが通らない」と言ってきた。調べてみたら原因はDockerfileのキャッシュ挙動の差異で、ローカルとCI環境でレイヤー順序の解釈が微妙に異なっていた。「またこれか……」というため息が出たのを今でも覚えている。

そこから本格的にDocker Compose V2とBuildKitの設定を見直し始めて約1年。チーム6人でマイクロサービス構成を運用する中で、「これは地味に効いた」という知見がかなり溜まってきた。今回はその実体験をそのまま書いていく。教科書的な話は最小限にして、実際にハマったポイントと「こう設定したら改善した」という話を中心にしたい。

なお、コンテナセキュリティ全般についてはすでに別の記事でまとめているので(コンテナセキュリティ完全ガイド2026｜eBPF・SBOM・サプライチェーン対策)、ここでは純粋に開発効率と運用品質に絞る。

Docker Compose V2 + BuildKit 2026年時点の「現在地」

2026年現在、Docker Engine 28.x系がリリースされており、BuildKit 0.19以降がデフォルトのビルドバックエンドとして統合されている。Compose V2（docker composeコマンド）もDocker Desktop 4.x以降では完全にV1のdocker-composeを置き換えている。

一応確認しておくと、バージョン状況はこんな感じだ。

コンポーネント	2024年初頭	2026年6月現在	主な変化
Docker Engine	25.x	28.x	containerd image store がデフォルト
BuildKit	0.12	0.19	cache mount の安定化、attestation 強化
Compose V2	2.24	2.32	`include` ディレクティブの安定化
Docker Desktop	4.27	4.40	Resource Saver モード搭載

BuildKitが「実験的機能」から「完全に普通のもの」になったのがここ2年の大きな変化で、今更DOCKER_BUILDKIT=1を環境変数で指定しているDockerfileやCIスクリプトを見かけると「古いな」と正直思う。

マルチステージビルド + cache mount で実現したビルド時間改善

正直、最初はキャッシュマウントの効果に懐疑的だった。「どうせCIではキャッシュが効かないでしょ」という先入観があったからだ。でも実際に設定してみると、予想以上に変わった。

うちのチームのPythonサービスのDockerfileを例に書くと、変更前後でこう変わった。

変更前（典型的なよくないパターン）

FROM python:3.13-slim as builder
WORKDIR /app
COPY requirements.txt .
RUN pip install -r requirements.txt
COPY . .
RUN python -m pytest

FROM python:3.13-slim
WORKDIR /app
COPY --from=builder /app .
CMD ["uvicorn", "main:app"]

変更後（BuildKit cache mount + マルチステージ最適化）

# syntax=docker/dockerfile:1.7
FROM python:3.13-slim AS base
WORKDIR /app
RUN apt-get update && apt-get install -y --no-install-recommends \
    build-essential \
    && rm -rf /var/lib/apt/lists/*

FROM base AS deps
COPY requirements.txt .
RUN --mount=type=cache,target=/root/.cache/pip \
    pip install --user -r requirements.txt

FROM base AS test
COPY --from=deps /root/.local /root/.local
COPY . .
ENV PATH=/root/.local/bin:$PATH
RUN --mount=type=cache,target=/root/.cache/pip \
    --mount=type=cache,target=/tmp/pytest_cache \
    python -m pytest --tb=short -q

FROM python:3.13-slim AS runtime
WORKDIR /app
COPY --from=deps /root/.local /root/.local
COPY --from=test /app/src ./src
COPY --from=test /app/main.py .
ENV PATH=/root/.local/bin:$PATH
EXPOSE 8000
CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]

ポイントは--mount=type=cacheでpipのダウンロードキャッシュをビルド間で共有している点だ。requirements.txtが変わらない限り、2回目以降のビルドではパッケージのダウンロードがほぼゼロになる。

CIでもこのキャッシュを活かすために、GitHub ActionsではBuildKit remote cacheを使ってECRにキャッシュを保存するように設定した。

# .github/workflows/build.yml（抜粋）
- name: Build and push
  uses: docker/build-push-action@v6
  with:
    context: .
    push: true
    tags: ${{ env.ECR_REGISTRY }}/${{ env.ECR_REPO }}:${{ github.sha }}
    cache-from: type=registry,ref=${{ env.ECR_REGISTRY }}/${{ env.ECR_REPO }}:buildcache
    cache-to: type=registry,ref=${{ env.ECR_REGISTRY }}/${{ env.ECR_REPO }}:buildcache,mode=max
    build-args: |
      BUILDKIT_INLINE_CACHE=1

これで実際に計測したビルド時間の変化がこれ。

xychart-beta
  title "Dockerビルド時間の改善（秒）"
  x-axis ["依存変更なし(初回)", "依存変更なし(2回目)", "依存変更あり(初回)", "依存変更あり(2回目)"]
  y-axis "ビルド時間（秒）" 0 --> 300
  bar [245, 245, 245, 245]
  bar [240, 38, 210, 45]

（青が変更前、橙が変更後）

依存関係が変わらないケースで245秒→38秒。マジで助かった。CI費用にも地味に効いてくる数字だ。

Docker Compose V2 の `include` ディレクティブと Profiles でチーム構成を整理した話

うちのリポジトリはモノレポ構成なんだけど（詳しくはモノレポ運用ガイド｜2026年ベストプラクティスと導入戦略を参照）、それに合わせてCompose設定も分割管理するようになった。

Compose V2のincludeディレクティブが2025年後半から安定して使えるようになって、これが思ったより便利だった。構成はこんな感じ。

.
├── compose.yml              # ルート（開発環境エントリポイント）
├── compose.prod.yml         # 本番向けオーバーライド
├── infra/
│   └── compose.infra.yml   # DB・Redis・Kafka等のインフラ層
├── services/
│   ├── api/
│   │   └── compose.api.yml
│   └── worker/
│       └── compose.worker.yml

# compose.yml
include:
  - path: infra/compose.infra.yml
  - path: services/api/compose.api.yml
  - path: services/worker/compose.worker.yml

# ローカル開発用の共通設定
x-common-env: &common-env
  LOG_LEVEL: debug
  OTEL_EXPORTER_OTLP_ENDPOINT: http://otel-collector:4318

# infra/compose.infra.yml
services:
  postgres:
    image: postgres:17-alpine
    volumes:
      - postgres_data:/var/lib/postgresql/data
    environment:
      POSTGRES_PASSWORD_FILE: /run/secrets/db_password
    secrets:
      - db_password
    healthcheck:
      test: ["CMD-SHELL", "pg_isready -U postgres"]
      interval: 5s
      timeout: 3s
      retries: 5

  redis:
    image: redis:7.4-alpine
    command: redis-server --maxmemory 256mb --maxmemory-policy allkeys-lru

secrets:
  db_password:
    file: ./secrets/db_password.txt

volumes:
  postgres_data:

secretsの扱いが2026年現在もたまに混乱するポイントで、environmentでパスワードを直書きしているDockerfileをコードレビューで見かけることがある。POSTGRES_PASSWORD_FILEを使ってファイル経由で渡すのが正解だ。個人的には、これを最初に説明しておくだけで後のセキュリティレビューがだいぶ楽になる。

Profilesも組み合わせると、「本番模擬環境だけ追加サービスを起動する」ような使い方ができる。

# services/api/compose.api.yml
services:
  api:
    build:
      context: ../../
      dockerfile: services/api/Dockerfile
      target: runtime
    ports:
      - "8000:8000"
    depends_on:
      postgres:
        condition: service_healthy
    profiles:
      - default
      - full

  api-debug:
    extends:
      service: api
    build:
      target: debug
    environment:
      DEBUGPY_ENABLE: "1"
    ports:
      - "5678:5678"  # debugpy
    profiles:
      - debug

# 通常起動
docker compose up

# デバッグモード
docker compose --profile debug up

# フル構成（負荷テスト用）
docker compose --profile full up

これを導入してから「あのサービスどうやって起動するんでしたっけ」問題がかなり減った。新メンバーが来たときの混乱が一番目に見えて減った気がする。

ローカル開発環境の全体構成と運用フロー

現在のチームの開発環境構成をざっくり図で表すとこうなる。

flowchart TB
  subgraph DEV["開発者ローカル環境"]
    direction TB
    subgraph COMPOSE["Docker Compose V2"]
      API["api\n(FastAPI)"]
      WORKER["worker\n(Celery)"]
      subgraph INFRA["インフラ層"]
        PG[("PostgreSQL 17")]
        REDIS[("Redis 7.4")]
        KAFKA["Kafka 3.8"]
      end
      subgraph OBS["観測性層"]
        OTEL["OTel Collector"]
        JAEGER["Jaeger UI\n:16686"]
        PROM["Prometheus\n:9090"]
      end
    end
    DEVTOOLS["Cursor / VS Code\n+ Dev Containers"]
  end

  subgraph CI["GitHub Actions"]
    BUILD["BuildKit Build\n+ cache to ECR"]
    TEST["pytest / vitest"]
    SCAN["Trivy SBOM Scan"]
  end

  subgraph REGISTRY["ECR"]
    IMAGE["コンテナイメージ"]
    CACHE["BuildKit Cache"]
  end

  DEVTOOLS -->|docker compose up| COMPOSE
  API <-->|healthcheck| PG
  API <-->|cache| REDIS
  WORKER <-->|consume| KAFKA
  API -->|traces/metrics| OTEL
  OTEL --> JAEGER
  OTEL --> PROM

  COMPOSE -->|push| CI
  CI -->|cache-from/cache-to| CACHE
  CI -->|push image| IMAGE

OTelコレクターをローカルにも入れてJaegerとPrometheusを繋いでいるのは、「本番で初めて遅いことに気づく」問題への対策だ。ローカルでもトレースを見ながら開発できると、パフォーマンス問題の発見が格段に早くなる。正直まだObservabilityの観点で改善余地はあるんだけど、ゼロよりは全然マシな状態になってきた。

1年運用してわかった「これが地味に効いた」設定集

Docker Desktop の Resource Saver を切る

Docker Desktop 4.35以降でデフォルト有効になったResource Saverモードが、ローカル開発で思わぬ待ちを生んでいた。一定時間操作がないとVMを休止させるんだけど、朝一番にdocker compose upすると再起動に10〜15秒かかる。地味にストレスで、チーム全員で無効化した。

# settings.json または Docker Desktop GUIで
# "resourceSaver": false

.dockerignore の見直し

Dockerfileより.dockerignoreの方が重要かもしれない、というのが1年の感想だ。特にNode.jsプロジェクトでnode_modulesを除外し忘れているケースが多い。

# .dockerignore（Pythonプロジェクト例）
**/__pycache__
**/*.pyc
**/*.pyo
.git
.github
.venv
venv
*.egg-info
dist
build
.pytest_cache
.mypy_cache
.ruff_cache
node_modules
*.md
docs/
tests/  # テストはビルドステージでのみ使う
.env
.env.*
secrets/

.envファイルを除外し忘れてイメージにAPIキーが入ってしまうインシデントは、うちのチームでも過去に一度あった。あれは本当に焦った。CIでdocker historyを使ってシークレットが混入していないか確認するステップを入れるのを強くお勧めしたい。

compose.override.yml でチームの衝突を防ぐ

地味に効いた設定がもう一つ。compose.override.ymlをgitignoreに入れることで、各自がローカルで追加設定を持てるようにした。

# compose.override.yml（gitignoreに追加、各自自由に編集）
services:
  api:
    environment:
      - DEBUG_SQL=1
    volumes:
      # ホットリロード用にローカルのコードをマウント
      - ./services/api/src:/app/src

これがないと「ホットリロード設定を入れたらCIが壊れた」みたいなことが起きる。チームに新しいメンバーが来たときに「override.ymlの存在を説明する」をオンボーディングに組み込んでいる。たった5行の説明で、後の混乱がかなり減る。

ビルド引数とシークレットの使い分け

ここは好み分かれるかもしれないけど、うちのチームでの使い分けルールを書いておく。

種別	用途	方法
`ARG`	ビルド時のバージョン指定・フラグ	`--build-arg`
`ENV`	コンテナ実行時の設定値	compose `environment`
`--secret`	ビルド時のみ必要な認証情報（private pip, npmレジストリ等）	`--mount=type=secret`
`secret`（compose）	実行時に必要なパスワード・証明書	ファイル経由マウント

# private PyPIを使うケース
FROM python:3.13-slim AS deps
RUN --mount=type=secret,id=pip_config,dst=/root/.config/pip/pip.conf \
    --mount=type=cache,target=/root/.cache/pip \
    pip install --user -r requirements.txt

# ビルド実行
docker buildx build \
  --secret id=pip_config,src=./secrets/pip.conf \
  -t myapp:latest .

このやり方なら認証情報がイメージレイヤーに残らない。CI/CDパイプラインでの実装については、CodePipeline V2とCodeBuild Fleetの記事も参考になるかもしれない。

ヘルスチェックの充実

depends_onのcondition: service_healthyを使いたいのに、ヘルスチェックが設定されていないサービスがある、というのはよくある問題だ。特にデータベース系はちゃんと設定しておかないと起動順序で毎回ハマる。

services:
  kafka:
    image: confluentinc/cp-kafka:7.7.0
    healthcheck:
      test: |
        kafka-topics --bootstrap-server localhost:9092 --list
      interval: 10s
      timeout: 10s
      retries: 10
      start_period: 30s

  api:
    depends_on:
      postgres:
        condition: service_healthy
      redis:
        condition: service_started  # redisは起動確認だけで十分なことが多い
      kafka:
        condition: service_healthy

start_periodは見落としがちだけど、KafkaやCassandraのような起動に時間がかかるサービスには必須だ。これを設定していないと、起動中のヘルスチェック失敗でコンテナが再起動ループに入る。一度ハマると地味に時間を溶かすので、最初から入れておいた方がいい。

まとめ

1年間のDocker Compose V2 + BuildKit運用で本当に効いた知見をまとめると、こういうことだった。

BuildKit cache mountはCIでも効く：ECRへのremote cacheを組み合わせると、依存変更なしのビルドを80%以上短縮できた
includeディレクティブ + Profilesで構成管理が劇的に楽になる：モノレポ構成との相性が特に良い
compose.override.ymlをgitignoreに入れる：チームメンバーが自由にローカル設定を持てる仕組みを最初に作るだけで、衝突が激減する
.dockerignoreとsecretsの取り扱いは最優先で整備する：後から直すより最初から正しくやる方がコストが低い
ヘルスチェックはサボらない：start_period含めてちゃんと設定すると、起動順序問題のデバッグに費やす時間がゼロになる

次のアクション候補：

既存プロジェクトの.dockerignoreを今日見直してみる（5分でできる）
docker buildx build --progress=plainでビルドの各ステップを可視化して、どのレイヤーが時間を食っているか確認する
ローカル環境にOTel Collectorを追加してトレースを入れてみる

皆さんのチームではCompose設定はどうしてますか？「こんな工夫してる」というのがあればぜひ教えてほしい。インシデント対応との連携についてはインシデント対応の最新ベストプラクティス2026も参考にどうぞ。

「ローカルでは動いた」が消えた日から1年

Docker Compose V2 + BuildKit 2026年時点の「現在地」

マルチステージビルド + cache mount で実現したビルド時間改善

Docker Compose V2 の include ディレクティブと Profiles でチーム構成を整理した話

ローカル開発環境の全体構成と運用フロー

1年運用してわかった「これが地味に効いた」設定集

Docker Desktop の Resource Saver を切る

.dockerignore の見直し

compose.override.yml でチームの衝突を防ぐ

ビルド引数とシークレットの使い分け

ヘルスチェックの充実

まとめ

関連記事

「ローカルでは動いたのに」が消えた日——BuildKit 2026年版でチーム開発が変わった話

EKS3年運用で月120万円の請求を半減｜Kubernetes本番の痛すぎる失敗と対策

月額500万円の請求書を見て動いた。AWS費用を30%削減した3ヶ月の実装記録

Terraformで3年分の失敗から学んだ、State管理とAI検証の正解

マルチクラウド戦略2026|最適構成とベストプラクティス

マルチクラウドで月30万円の無駄に気づくまで──失敗から学んだ現実的な使い分け

Docker Compose V2 の `include` ディレクティブと Profiles でチーム構成を整理した話