完整流程复现示例
一、示例概览
本节使用一个 产品测试效率对比 的真实案例,完整展示多 Agent 协作从方案制定到结果审阅的全过程。这个示例可以帮助理解各角色之间的协作关系、人工参与节点以及最终产出的文档形式。
基本信息
| 项目 | 内容 |
|---|---|
| 分析任务 | 产品测试效率对比 |
| 所属阶段 | 第二阶段 - 负责人效能与产品洞察 |
| 数据文件 | 脱敏数据_特征增强.xlsx |
| 数据口径 | 6671 条记录,完全不去重 |
| 全流程用时 | 约 20 分钟(主要耗时在人工阅读与确认) |
二、阶段一:方案制定(DataAnalyst)
输入
DataAnalyst 接收任务描述:深入分析各子产品的测试效率和转化表现,识别高效产品与低效产品的差异特征。
关键设计决策
在方案制定中,DataAnalyst 做了以下核心设计:
分析范围:
- 仅分析子产品维度,不分析售前主产品、系统主产品
- 以"申请→已接入转化率"为核心指标
需求清单(Checklist 格式):
### 1. 产品基础效能排名
- [ ] 各子产品的记录总数
- [ ] 各子产品的平均测试周期(天)、中位数、标准差
- [ ] 各子产品的申请→已接入转化率(%)(核心指标)
- [ ] 各子产品的申请→已调用转化率(%)
- [ ] 各子产品的不接入流失率(%)
### 2. 产品不接入原因分布
- [ ] 各子产品的不接入原因分布(产品力不足/客户侧收益不足等)
### 3. 高效产品与低效产品对比
- [ ] 高效产品(转化率 Top 2)的特征汇总
- [ ] 低效产品(转化率 Bottom 2)的特征汇总
输出检查清单:
| 输出项 | 格式 | 路径 |
|---|---|---|
| Excel 详细数据 | .xlsx | 执行分析结果/ |
| Markdown 关键指标摘要 | .md | 执行分析结果/ |
| 产品效能排名图 | .png | 执行分析结果/ |
| 高效 vs 低效产品对比图 | .png | 执行分析结果/ |
注意事项:
- 数据完全不去重,保留所有原始记录
- 高效产品识别:按转化率排序取前 2 名
- 低效产品识别:按转化率排序取后 2 名
三、阶段二:脚本编写与执行(ScriptWriter + Human)
脚本生成
ScriptWriter 根据方案文档生成 Python 脚本,核心逻辑包括:
- 读取数据 → 按子产品维度分组统计
- 计算测试周期(平均/中位数/标准差)
- 计算转化率(申请→已接入转化率、申请→已调用转化率)
- 计算流失率(不接入流失率)
- 生成综合效能得分(基于转化率百分位排名)
- 分析不接入原因分布
- 识别 Top 2 高效产品和 Bottom 2 低效产品
- 输出 Excel、Markdown、PNG 三种格式的结果
关键代码片段
# 产品基础效能排名计算
product_total = df.groupby("子产品名称").size().rename("记录总数")
cycle_stats = df.groupby("子产品名称")["测试周期(天)"].agg(
平均测试周期="mean",
中位数测试周期="median",
标准差测试周期="std",
)
# 转化率计算
product_stats["申请→已接入转化率(%)"] = (
product_stats["已接入数量"] / product_stats["记录总数"] * 100
).round(2)
# 高效/低效产品识别
top_products = stats_for_rank.sort_values(
"申请→已接入转化率(%)", ascending=False
).head(2).index.tolist()
人工执行
Human 在本地环境执行脚本,生成:
2.3_产品测试效率对比.xlsx— 详细数据2.3_产品测试效率对比摘要.md— 关键指标摘要2.3_产品效能排名.png— 排名可视化2.3_产品效能对比.png— 对比可视化
四、阶段三:一致性审阅(Reviewer)
审阅过程
Reviewer 对比方案文档和脚本执行结果,逐项检查一致性。
审阅结论
整体结论:方案需求清单已全部在脚本和 Markdown 摘要中实现,脚本设计严谨,计算逻辑与方案高度一致。
一致性详情:
| 检查项 | 结果 | 说明 |
|---|---|---|
| 数据口径 | ✅ | 使用特征增强数据,未去重,与方案一致 |
| 产品维度 | ✅ | 仅分析子产品,符合方案要求 |
| 基础效能排名 | ✅ | 所有信息项齐全 |
| 不接入原因分布 | ✅ | 数量 + 占比均已计算 |
| 高效/低效产品对比 | ✅ | Top 2/Bottom 2 识别正确 |
| 输出文件完整性 | ✅ | Excel + Markdown + 两张 PNG 均已生成 |
发现的细节问题:
-
⚠️ "最低产品"与 Bottom 2 展示不一致:Markdown 摘要中"低效产品特征"展示的是数字平台、云引擎(转化率 0%),而"关键发现"中写的是"转化率最低产品:数字工具(0.00%)"。原因是 Bottom 2 和 idxmin() 使用了不同的排序逻辑。
-
⚠️ 综合效能得分的计算口径在方案中未显式定义,脚本中使用的是"转化率百分位排名",逻辑合理但建议在方案中补充说明。
审阅的工程价值
这个示例展示了审阅 Agent 在实际使用中的重要价值:
- 发现了文内不一致问题(人类阅读时可能忽略)
- 确认了核心逻辑正确性(给交付增加信心)
- 提出了改进建议(虽然不阻塞交付)
五、阶段四:人工复核
Human 阅读审阅报告后:
- 确认核心逻辑没有问题
- 记录展示层面的不一致作为改进项
- 关闭当前流程,进入下一阶段
六、流程总结
时间分配
| 环节 | 时间 | 主导者 |
|---|---|---|
| 方案制定与多轮确认 | ~8 分钟 | DataAnalyst + Human |
| 脚本编写 | ~3 分钟 | ScriptWriter |
| 本地执行 | ~2 分钟 | Human |
| 一致性审阅 | ~3 分钟 | Reviewer |
| 人工复核 | ~4 分钟 | Human |
| 总计 | ~20 分钟 | - |
关键启示
- 职责分明:每个角色只做自己分内的事,不越界
- 过程留痕:所有交互以文档形式保存,可完整回溯
- 质量闭环:从方案到执行再到审阅,形成质量保障链
- 人工可控:在关键节点人工介入,保证方向和质量的正确性
- 高效协同:约 20 分钟完成从方案到交付的完整闭环