完整流程复现示例

一、示例概览

本节使用一个 产品测试效率对比 的真实案例，完整展示多 Agent 协作从方案制定到结果审阅的全过程。这个示例可以帮助理解各角色之间的协作关系、人工参与节点以及最终产出的文档形式。

基本信息

项目	内容
分析任务	产品测试效率对比
所属阶段	第二阶段 - 负责人效能与产品洞察
数据文件	脱敏数据_特征增强.xlsx
数据口径	6671 条记录，完全不去重
全流程用时	约 20 分钟（主要耗时在人工阅读与确认）

二、阶段一：方案制定（DataAnalyst）

输入

DataAnalyst 接收任务描述：深入分析各子产品的测试效率和转化表现，识别高效产品与低效产品的差异特征。

关键设计决策

在方案制定中，DataAnalyst 做了以下核心设计：

分析范围：

仅分析子产品维度，不分析售前主产品、系统主产品
以"申请→已接入转化率"为核心指标

需求清单（Checklist 格式）：

### 1. 产品基础效能排名
- [ ] 各子产品的记录总数
- [ ] 各子产品的平均测试周期（天）、中位数、标准差
- [ ] 各子产品的申请→已接入转化率（%）（核心指标）
- [ ] 各子产品的申请→已调用转化率（%）
- [ ] 各子产品的不接入流失率（%）

### 2. 产品不接入原因分布
- [ ] 各子产品的不接入原因分布（产品力不足/客户侧收益不足等）

### 3. 高效产品与低效产品对比
- [ ] 高效产品（转化率 Top 2）的特征汇总
- [ ] 低效产品（转化率 Bottom 2）的特征汇总

输出检查清单：

输出项	格式	路径
Excel 详细数据	.xlsx	执行分析结果/
Markdown 关键指标摘要	.md	执行分析结果/
产品效能排名图	.png	执行分析结果/
高效 vs 低效产品对比图	.png	执行分析结果/

注意事项：

数据完全不去重，保留所有原始记录
高效产品识别：按转化率排序取前 2 名
低效产品识别：按转化率排序取后 2 名

三、阶段二：脚本编写与执行（ScriptWriter + Human）

脚本生成

ScriptWriter 根据方案文档生成 Python 脚本，核心逻辑包括：

读取数据 → 按子产品维度分组统计
计算测试周期（平均/中位数/标准差）
计算转化率（申请→已接入转化率、申请→已调用转化率）
计算流失率（不接入流失率）
生成综合效能得分（基于转化率百分位排名）
分析不接入原因分布
识别 Top 2 高效产品和 Bottom 2 低效产品
输出 Excel、Markdown、PNG 三种格式的结果

关键代码片段

# 产品基础效能排名计算
product_total = df.groupby("子产品名称").size().rename("记录总数")

cycle_stats = df.groupby("子产品名称")["测试周期（天）"].agg(
    平均测试周期="mean",
    中位数测试周期="median",
    标准差测试周期="std",
)

# 转化率计算
product_stats["申请→已接入转化率(%)"] = (
    product_stats["已接入数量"] / product_stats["记录总数"] * 100
).round(2)

# 高效/低效产品识别
top_products = stats_for_rank.sort_values(
    "申请→已接入转化率(%)", ascending=False
).head(2).index.tolist()

人工执行

Human 在本地环境执行脚本，生成：

2.3_产品测试效率对比.xlsx — 详细数据
2.3_产品测试效率对比摘要.md — 关键指标摘要
2.3_产品效能排名.png — 排名可视化
2.3_产品效能对比.png — 对比可视化

四、阶段三：一致性审阅（Reviewer）

审阅过程

Reviewer 对比方案文档和脚本执行结果，逐项检查一致性。

审阅结论

整体结论：方案需求清单已全部在脚本和 Markdown 摘要中实现，脚本设计严谨，计算逻辑与方案高度一致。

一致性详情：

检查项	结果	说明
数据口径	✅	使用特征增强数据，未去重，与方案一致
产品维度	✅	仅分析子产品，符合方案要求
基础效能排名	✅	所有信息项齐全
不接入原因分布	✅	数量 + 占比均已计算
高效/低效产品对比	✅	Top 2/Bottom 2 识别正确
输出文件完整性	✅	Excel + Markdown + 两张 PNG 均已生成

发现的细节问题：

⚠️ "最低产品"与 Bottom 2 展示不一致：Markdown 摘要中"低效产品特征"展示的是数字平台、云引擎（转化率 0%），而"关键发现"中写的是"转化率最低产品：数字工具（0.00%）"。原因是 Bottom 2 和 idxmin() 使用了不同的排序逻辑。
⚠️ 综合效能得分的计算口径在方案中未显式定义，脚本中使用的是"转化率百分位排名"，逻辑合理但建议在方案中补充说明。

审阅的工程价值

这个示例展示了审阅 Agent 在实际使用中的重要价值：

发现了文内不一致问题（人类阅读时可能忽略）
确认了核心逻辑正确性（给交付增加信心）
提出了改进建议（虽然不阻塞交付）

五、阶段四：人工复核

Human 阅读审阅报告后：

确认核心逻辑没有问题
记录展示层面的不一致作为改进项
关闭当前流程，进入下一阶段

六、流程总结

时间分配

环节	时间	主导者
方案制定与多轮确认	~8 分钟	DataAnalyst + Human
脚本编写	~3 分钟	ScriptWriter
本地执行	~2 分钟	Human
一致性审阅	~3 分钟	Reviewer
人工复核	~4 分钟	Human
总计	~20 分钟	-

关键启示

职责分明：每个角色只做自己分内的事，不越界
过程留痕：所有交互以文档形式保存，可完整回溯
质量闭环：从方案到执行再到审阅，形成质量保障链
人工可控：在关键节点人工介入，保证方向和质量的正确性
高效协同：约 20 分钟完成从方案到交付的完整闭环

← 上一章：数据安全与人工在环机制 | Multi-Agent协作框架-MOC | 下一章：实战案例 →