2026/03/05
本地部署智能体实施指南:上线验收
作者: 瀚铄智擎交付与质量组
本文用于指导本地/专网智能体项目的上线验收。目标是把“可演示”转化为“可上线、可审计、可持续运行”。
1. 验收总则
上线验收必须满足三项原则:
- 指标客观:全部结论基于可重复测量数据。
- 过程完整:测试过程可追溯、可复核。
- 责任明确:每项验收结论有责任角色签署。
2. 验收范围
建议按五个维度组织验收:
| 维度 | 验收目标 | 主要证据 |
|---|---|---|
| 功能验收 | 业务流程完整可执行 | 测试用例报告、流程回放 |
| 性能验收 | 时延与吞吐满足目标 | 压测报告、监控快照 |
| 稳定性验收 | 连续运行无关键故障 | 长稳测试与故障演练记录 |
| 合规验收 | 数据边界与审计可追溯 | 权限策略、日志抽检、审批记录 |
| 运维验收 | 告警、备份、回滚可执行 | SOP、演练记录、值守机制 |
3. 验收门禁(Go/No-Go)
上线前需设置硬性门禁,不满足即不放行。
| 门禁项 | 最低要求 | 放行规则 |
|---|---|---|
| 关键功能通过率 | 100% | 任一失败则 No-Go |
| 端到端 P95 时延 | 达到合同阈值 | 超阈值则整改重测 |
| 审计链完整率 | 100% | 不完整则 No-Go |
| 回滚演练成功 | 100% | 失败则 No-Go |
| 高风险缺陷数 | 0 | 存在则 No-Go |
4. 功能验收方法
4.1 用例分层
- 正常流程用例:验证标准任务路径。
- 异常流程用例:验证超时、失败、回退。
- 边界条件用例:高并发、长上下文、依赖抖动。
4.2 用例模板
| 字段 | 说明 |
|---|---|
| case_id | 用例编号 |
| pre_condition | 前置条件 |
| input | 输入数据 |
| expected_output | 预期输出 |
| verification | 验证方法 |
| result | 通过/失败 |
5. 性能与稳定性验收
5.1 压测方案
压测至少覆盖以下场景:
- 日常均值负载(1x)
- 峰值负载(2x)
- 突发脉冲负载(3x,短时)
5.2 关键指标口径
| 指标 | 口径定义 | 目标示例 |
|---|---|---|
| 任务成功率 | 成功任务数/总任务数 | ≥ 98.5% |
| P95 时延 | 95 分位端到端时延 | ≤ 2.5s |
| P99 时延 | 99 分位端到端时延 | ≤ 4.0s |
| 工具调用成功率 | 成功调用次数/总调用次数 | ≥ 99.0% |
| 回滚成功率 | 回滚成功次数/回滚触发次数 | ≥ 99.5% |
5.3 长稳测试
建议连续运行不少于 72 小时,记录:
- 内存增长曲线与资源泄漏。
- 异常告警频次与恢复时间。
- 任务积压与队列波动。
6. 合规与审计验收
6.1 合规检查项
- 数据不出域策略已生效。
- 权限分级与最小权限策略可验证。
- 日志留存策略符合合同和制度要求。
- 高风险操作存在双人审批或同等级审批机制。
6.2 审计抽检样本
| 样本类型 | 抽检规模 | 验收标准 |
|---|---|---|
| 常规任务 | ≥ 30 条 | 三层证据链完整 |
| 失败任务 | ≥ 10 条 | 有失败原因与回滚记录 |
| 例外放行任务 | 全量 | 有审批与期限记录 |
7. 运维交接验收
运维验收重点不是文档数量,而是“值守人员能否按 SOP 处置”。
7.1 必交付文档
- 架构与拓扑说明书。
- 上线运行手册与应急预案。
- 监控告警手册。
- 备份恢复与回滚手册。
- 版本发布与变更管理规范。
7.2 运维演练
| 演练项 | 验收目标 | 时限 |
|---|---|---|
| 服务异常重启 | 识别并恢复 | ≤ 5 分钟 |
| 版本回滚 | 按流程回退并验证 | ≤ 10 分钟 |
| 审计追溯查询 | 定位单任务全链路证据 | ≤ 3 分钟 |
| 备份恢复 | 恢复关键数据可用 | ≤ 30 分钟 |
8. 验收报告模板
上线验收报告至少包含:
- 项目范围与验收依据
- 测试环境与版本清单
- 各维度验收结果
- 不符合项与整改计划
- 放行结论(Go/No-Go)
- 签署页(甲方、乙方、监理/审计可选)
9. 上线前 Checklist
- 所有关键功能用例通过率为 100%。
- 性能指标达到合同阈值。
- 72 小时长稳测试完成且无阻断级故障。
- 合规抽检通过,审计链完整率为 100%。
- 运维交接演练完成并签署记录。
- 上线回滚方案通过演练验证。
10. 本章结论
本地部署项目的上线验收应从“是否可演示”升级为“是否可持续运行”。通过五维度验收、硬性门禁、可追溯证据和运维演练,能够将上线风险前置消减,保障生产环境长期稳定。