作用
Benchmark Server 用于加载评测数据集,常用于基准测试、问答任务或生成任务中的数据配置阶段。我们强烈推荐将数据预处理为
.jsonl
格式。参数说明
以下是servers/benchmark/parameter.yaml
的配置文件:
name
:数据集名称,用于日志、调试或在系统中标识当前加载的数据集。path
:数据文件路径,作为get_data
工具的读取入口。key_map
:字段映射表,指定从每条样本中提取哪些字段,并设定其别名。- 例如:
q_ls: question
表示将原字段question
映射为q_ls
。 - 如需添加额外字段,可在此处扩展,如
p_ls: retrieved_passage
。
- 例如:
shuffle
:是否启用随机采样seed
:设置随机种子limit
:加载的样本数量;-1
代表加载全部数据
工具函数说明
get_data
:该工具函数用于在数据预处理阶段加载并解析数据,提取关键字段(如问题、答案、检索段落等),供下游模块使用。