L2 CONFIDENTIAL

Factory 実行報告 (2026-03-24)

Factory 実行報告 (2026-03-24)

概要

本日はFactory基盤の実運用化を最優先で進め、E2E実行確認、監視強化、Grafana集約まで実施した。

実施内容

1. 実行経路の再同定と確定

  • 本番稼働対象を /home/mtdnot/factory-inngest に確定
  • Vercel本番メタデータ確認
  • 実行経路を確定:
    • GitLab Webhook → factory-inngest (Vercel)
    • Inngest event factory/issue.ready
    • factory.mtdnot.dev/api/implement (OpenClaw)
    • GitLab commit/MR

2. E2E実行確認

  • 複数Issueを ai-ready で投入
  • branch/MR生成を確認
  • 直近検証Issueで in-progress 遷移確認

3. 監視基盤の強化(P0)

  • functions.ts に実行開始/失敗理由の観測点追加
  • Issue note へ Factory run started / Factory fatal error を記録
  • 失敗時ラベルを ci-failed,needs-human へ自動遷移
  • escalationReason, retries, timeoutMinutes を記録

4. サイレント停止の解消

  • 検証Issueで原因を可視化:
    • Factory fatal error: Factory webhook failed: 502
  • 「止まった事実」だけでなく「止まった理由」を追跡可能化

5. Grafana集約

  • Grafana dashboard 作成:
    • Factory Observability v1
    • UID: factory-observability-v1
  • パネル:
    • Run Logs (OTLP)
    • Run Started (1h)
    • Run Failed/Fatal (1h)
    • Runs Over Time

作成/更新した主要成果物

Directus(L2)

  • Factory L2 Master Spec (2026-03-24)
    • id: d3e0a17e-4d41-4017-a38a-53abcded7700
  • Factory v1.0 仕様書目次
    • id: 51a5b9b2-4ad3-46bb-8570-07b4259f0257
  • Factory v1.0 機能要件/非機能要件/構成図/ER図(7点)

コード

  • /home/mtdnot/factory-inngest/app/functions.ts
    • 監視・障害可視化・OTLP送信強化

現在の状態

  • 実行ルート: 稼働
  • 監視: Issue note + Grafanaで可視化
  • 未解決: webhook 502 の根本原因切り分け

次アクション

  1. factory.mtdnot.dev/api/implement の 502原因切り分け
  2. failure reason 別のダッシュボード追加
  3. 通知チャンネル (1486011707813007531) へ失敗即時通知を追加

結論

本日は「動く」状態から「止まった理由が分かる」状態へ進めた。 次段階は、502根本原因を潰して成功率を安定化させる。