.jsonl
格式。servers/benchmark/parameter.yaml
的配置文件:
name
:数据集名称,用于日志、调试或在系统中标识当前加载的数据集。path
:数据文件路径,作为 get_data
工具的读取入口。key_map
:字段映射表,指定从每条样本中提取哪些字段,并设定其别名。
q_ls: question
表示将原字段 question
映射为 q_ls
。p_ls: retrieved_passage
。shuffle
:是否启用随机采样seed
:设置随机种子limit
:加载的样本数量;-1
代表加载全部数据get_data
:该工具函数用于在数据预处理阶段加载并解析数据,提取关键字段(如问题、答案、检索段落等),供下游模块使用。