论文:https://arxiv.org/pdf/2212.10509IRCoT 的核心思想是:在每一轮中,模型基于当前检索到的文档、历史推理链和问题生成新的推理内容(CoT),并据此触发下一轮检索。 这一交替式的循环可持续推进推理深度,直至满足终止条件(如明确回答已生成)。因此,它需要对多轮中间结果进行有效记录与访问——这正是 UltraRAG 中 Memory 机制的用武之地。
memory_
即可访问之前每轮迭代的中间结果。
prompt/IRCoT.jinja
中定义提示模板,样例如下:
examples/parameter/IRCoT_parameter.yaml
,配置如下内容: