🦞 Cron 系统健康巡检报告

定时任务修复专家(Cron Doctor)· 首次全量巡检
📅 2026年5月24日 13:30 · 主管:小杨(Main Agent) · 汇报对象:张总
31
总任务数
22
✅ 正常运行
7
❌ 异常
2
⏸ 空闲/未到期

🔍 诊断结论 核心

✅ 好消息:所有异常 job 的根因完全一致 — 模型调用超时(timeout)

🔧 已配置的修复方案:

deepseek-v4-flash 超时后 → sensenova-6.7-flash-litestepfun-ai/step-3.5-flashnemotron-3-super

• 三层 fallback,两个不同 NVIDIA API Key 防限流

🟢 预计效果:下次调度时 fallback 链会自动生效,7个异常 job 应能恢复正常

📋 处理过程 小杨 × 定时任务修复专家

Step 1 · 小杨
🛠 创建 定时任务修复专家 Agent
配模型链路 gpt-oss-120b → nemotron → sensenova,建知识库(巡检协议+配置规范)
Step 2 · 小杨
🎯 配置 deepseek 三重 fallback
deepseek → sensenova → stepfun-ai-flash → nemotron(不同 API Key 防限流)
Step 3 · 小杨
📥 安装 clawhub + gh CLI
clawhub v0.17.0 · gh v2.92.0(summarize 仅 macOS 跳过)
Step 4 · 定时任务修复专家
🔎 执行全量巡检扫描
扫描 31 个 job,识别 7 个异常,全部为 timeout
Step 5 · 小杨
📊 生成此网页报告
汇总数据 + 分析 + 建议,输出可视化报告

📊 全部任务状态 31 个

任务名称上次运行耗时状态
喝水提醒9:309s✅ ok
rain-alert-afternoon16:30(昨天)32s✅ ok
每周对话总结周日 20:0043s✅ ok
每日对话精华整理22:30(昨天)65s✅ ok
Daily Memory Check23:00(昨天)91s✅ ok
Daily Memory 提纯23:30(昨天)339s✅ ok
news-daily-produce3:00243s✅ ok
edu-collect3:3032s✅ ok
edu-produce4:00122s✅ ok
每日养生要点(yisheng)5:3032s✅ ok
weather-putian-prefetch5:5047s✅ ok
weather-xianyou-prefetch5:5026s✅ ok
drink-recommend-prefetch5:5527s✅ ok
天气发送(莆田+仙游)6:0029-35s✅ ok
news-daily-review6:0039s✅ ok
rain-alert-morning6:3031s✅ ok
抖音升级后续工作8:0061s❌ error
edu-review11:4847s✅ ok
抖音教育午报自动生成12:001605s✅ ok
工作区健康检查22:00(昨天)80s❌ error
每日记忆归档23:00(昨天)61s❌ error
yisheng proactive memory23:00(昨天)121s❌ error
Weekly Reverse Prompting周日 20:0033s✅ ok
Knowledge Base Check周六530s✅ ok
Skill Inventory Audit周六77s❌ error
system-health-check3:0061s❌ error
每日紫微斗数养生指南6:1061s❌ error
desktop-weekly-cleanup⏸ idle
edu-archive-cleanup⏸ idle
wx-cli 测试提醒5月20日19s✅ ok

❌ 异常详情 7 个

❌ 工作区健康检查

ID: a53beadf · 连续错误: 3 次 · 最后耗时: 80s
⏱ 模型超时(timeout)— deepseek-v4-flash 未在 300s 内响应

❌ 每日记忆归档

ID: 8664f318 · 连续错误: 2 次 · 最后耗时: 61s
⏱ 模型超时(timeout)

❌ yisheng proactive memory heartbeat

ID: 4fc4c15b · 连续错误: 1 次 · 最后耗时: 121s
⏱ 模型超时(timeout)

❌ system-health-check

ID: a5d3ee64 · 连续错误: 3 次 · 最后耗时: 61s
⏱ 模型超时(timeout)

❌ 每日紫微斗数养生指南

ID: 27ab24fc · 连续错误: 3 次 · 最后耗时: 61s
⏱ 模型超时(timeout)

❌ 抖音升级后续工作

ID: douyin-upgrade-followup · 连续错误: 2 次 · 最后耗时: 61s
⏱ 模型超时(timeout)

❌ Skill Inventory Audit

ID: skill-inventory-audit-weekly · 连续错误: 1 次 · 最后耗时: 77s
⏱ 模型超时(timeout)

✅ 已执行修复 3 项

🔄 deepseek → sensenova → stepfun-ai-flash → nemotron 三层 fallback
✅ 已完成
🔄 config 脏数据修复(douyin-maker identity 嵌入换行符)
✅ 已完成
🔄 安装 clawhub CLI + gh CLI(Gateway 需重启生效)
✅ 已完成

📌 待办事项 2 项

📋 等待下次调度验证 fallback 链路是否生效
⏳ 待观察
🧹 wx-cli 测试提醒通道警告需要修复
⏳ 待处理

💡 建议

1️⃣ 等待下一次调度 — fallback 链已配置完成,7个异常 job 下次自动触发时应该会走 NVIDIA 模型链路

2️⃣ 观察 24 小时 — 如果 1 天后仍有 error,启动 Level 2 修复(调整 timeoutSeconds)

3️⃣ 后续 cron-doctor 每 2 小时自动巡检 — 异常自动上报,不用手动检查