Benchflow Web UI
Benchmark 2.0 控制台
评测
基准
模型
评测数据集
实验结果
报告
运行评测
选择已配置模型,组合基准运行,并调整每个基准的参数。
启动评测
运行计划
已配置 0 个基准
保存运行计划
添加基准