Factory 実行報告 (2026-03-24)
Factory 実行報告 (2026-03-24)
概要
本日はFactory基盤の実運用化を最優先で進め、E2E実行確認、監視強化、Grafana集約まで実施した。
実施内容
1. 実行経路の再同定と確定
- 本番稼働対象を
/home/mtdnot/factory-inngestに確定 - Vercel本番メタデータ確認
- 実行経路を確定:
- GitLab Webhook → factory-inngest (Vercel)
- Inngest event
factory/issue.ready factory.mtdnot.dev/api/implement(OpenClaw)- GitLab commit/MR
2. E2E実行確認
- 複数Issueを
ai-readyで投入 - branch/MR生成を確認
- 直近検証Issueで
in-progress遷移確認
3. 監視基盤の強化(P0)
functions.tsに実行開始/失敗理由の観測点追加- Issue note へ
Factory run started/Factory fatal errorを記録 - 失敗時ラベルを
ci-failed,needs-humanへ自動遷移 escalationReason,retries,timeoutMinutesを記録
4. サイレント停止の解消
- 検証Issueで原因を可視化:
Factory fatal error: Factory webhook failed: 502
- 「止まった事実」だけでなく「止まった理由」を追跡可能化
5. Grafana集約
- Grafana dashboard 作成:
- Factory Observability v1
- UID:
factory-observability-v1
- パネル:
- Run Logs (OTLP)
- Run Started (1h)
- Run Failed/Fatal (1h)
- Runs Over Time
作成/更新した主要成果物
Directus(L2)
- Factory L2 Master Spec (2026-03-24)
- id:
d3e0a17e-4d41-4017-a38a-53abcded7700
- id:
- Factory v1.0 仕様書目次
- id:
51a5b9b2-4ad3-46bb-8570-07b4259f0257
- id:
- Factory v1.0 機能要件/非機能要件/構成図/ER図(7点)
コード
/home/mtdnot/factory-inngest/app/functions.ts- 監視・障害可視化・OTLP送信強化
現在の状態
- 実行ルート: 稼働
- 監視: Issue note + Grafanaで可視化
- 未解決: webhook 502 の根本原因切り分け
次アクション
factory.mtdnot.dev/api/implementの 502原因切り分け- failure reason 別のダッシュボード追加
- 通知チャンネル (
1486011707813007531) へ失敗即時通知を追加
結論
本日は「動く」状態から「止まった理由が分かる」状態へ進めた。 次段階は、502根本原因を潰して成功率を安定化させる。