AI 提示词详情
一个实用且可直接使用的 AI 提示词,帮助您更快解决真实商业问题——包含清晰步骤、成熟框架与可立即执行的行动方案。
设计可观测的自动化工作流(重试、告警、状态与恢复)
让自动化可观测、可排错,并且能安全恢复运行。

解决的问题
即便有错误处理,缺乏可见性、重试策略与恢复路径的工作流仍会“静默失败”,难以在生产环境可信运行。
重试设计
防止瞬时故障导致工作流中断。
运营可见性
在用户发现之前先发现故障。
AI 提示使用说明
请扮演负责可靠性的资深自动化工程师。
基于下面的工作流,把它升级为“可观测 + 可恢复”。
输入工作流:
[粘贴《设计可靠自动化工作流(触发器与错误处理)》输出]
交付物:
1) 重试策略
- 哪些步骤需要重试
- 重试上限与退避策略
2) 状态管理
- 需要追踪哪些状态
- 状态存储在哪里
3) 可观测性(Observability)
- 需要记录哪些日志
- 需要追踪哪些指标
- 告警条件与严重级别
4) 恢复路径(Recovery)
- 部分失败后如何继续/恢复
- 如何避免重复处理
5) 维护清单
- 当工作流变化时需要复核什么
请具体并贴近实现细节。
预期结果
一套包含明确重试、告警、状态追踪与恢复逻辑的工作流升级方案。
实施步骤
1
粘贴基础工作流
使用已具备基础错误处理的工作流。
3 minutes2
加入可观测能力
实现重试、告警与状态追踪。
10 minutes





