SpecAgent Lab
智能体运行与结果中心
可直接使用
首页
试运行
批量测试
结果总览
最近一次运行
查看结果总览
首页
试运行
批量测试
结果总览
运行记录
批量测试
多轮任务 Benchmark
选择任务,批量运行 baseline 与 spec workflow,对比质量、速度、成本和上下文压缩收益。
已选 3 个任务
2 种模式