SpecAgent Lab
智能体运行与结果中心
可直接使用
首页
试运行
批量测试
结果总览
最近一次运行
查看结果总览
首页
试运行
批量测试
结果总览
运行记录
运行详情
示例运行详情
当前页面用于预览运行详情布局。完成一次 playground 或 benchmark 后,这里会显示真实的多轮运行记录、工具调用与评测结果。
结果总览
批量测试