canary

其他 已审计 @garrytan v1.0.0
信任分
92/100
兼容 Agent
1
速查档案 只列事实:领域、Agent、信任分、作者、原文章节。装与不装请看下方作者解读。
领域
通用
兼容 Agent
Claude Code
信任分
92 / 100 · 已通过审计
作者 / 版本 / 许可
@garrytan · v1.0.0 · 未声明 license
安装命令数
1 条

需要注意: 未限定 allowed-tools,默认拥有全部工具权限。

想读作者英文原文? ↓ 滚到正文区切换 · 在 GitHub 查看 ↗

解读由编辑根据原文凝练而成,命令、链接、术语均与作者原文一致;想看完整论述请切到右侧

设计思路

canary 是给 Web 部署做「金丝雀视觉巡检」的:发布上线后,它会在后台周期性截屏、对比基线、抓控制台报错,不健康就告警,让你不用盯着浏览器手动 F5。设计原则写得很实在:对相对变化告警,不对绝对值告警——2×baseline 才算回归,1.5× 还在正常波动;仅在连续 ≥2 次 check 都异常时才报,避开偶发抖动。

工作流(七阶段)

  1. Setup:跑前置健康检查,确认 $B daemon 在线。
  2. Baseline:第一次跑用 --baseline 建立基线截图;没有基线时只能当健康检查用。
  3. Monitor:每隔 N 秒抓页面截图 + 控制台 + 网络。
  4. Alert:发现异常则按 critical/high/medium 级别报,每条带截图路径作为证据——「截图就是证据,没有例外」。
  5. Decide:异常时让用户在 4 个选项里选——停止巡检 / 继续观察 / 立即回滚 / 标记为误报。
  6. Health Report:跑完打一份 CANARY REPORT,包含每页状态、报警数、平均加载耗时;写到 .gstack/canary-reports/{date}-canary.md + .json,并 append 一条 JSONL 让 review dashboard 消费。
  7. Baseline Update:如果一切健康,问一下要不要把当前截图升为新基线。

适合谁

  • 部署后想自动监控的小团队(没有 Datadog 这类基础设施)
  • 视觉回归敏感的前端项目
  • 做功能开关 rollout 时想观察 1~5 分钟的工程师

何时不该用

  • 后端无 UI 的服务——这工具看不到东西
  • 需要长期监控(24×7)——这是巡检不是监控系统

配套

browse(驱动 Chromium)、land-and-deploy(部署完触发巡检)、gstack-openclaw-retro(消费 dashboard 数据)连成 ship → canary → review 的链路。read-only——除非你明确让它修,它只观察不改代码。