replace_recent_steps()的作用 #36

mhdpr · 2025-04-25T03:00:55Z

请问run_search_o1.py代码中函数replace_recent_steps()的触发条件和作用分别是什么？我仔细阅读了代码，并查看在使用deepseek-r1:8b模型时seq['output']的输出，暂未发现包含step的部分

sunnynexus · 2025-05-08T01:06:18Z

你好，在Reason-in-Documents模块输入的当前推理链会优先选择搜索和返回结果的历史，要是拼接完整推理链的话可能会过长而影响效果，因此这里进行了筛选。

对于DeepSeek-R1-Distill系列模型，由于其指令遵循能力较差，直接prompt可能调用搜索比较少。因此建议优先选择QwQ模型进行实验。若希望使用小参数的R1模型，可以尝试我们最新的方法WebThinker，其中有训练的DeepSeek-R1-7B模型，有更好的调用搜索等工具的能力。

Provide feedback