DeepResearch
DeepResearch copied to clipboard
目前开源的inference流程不是WebResearcher的流程?
感谢各位的工作!
我尝试按照Quick Start的引导跑通inference的流程,发现其中使用的流程是,
-
每次将assistant或者tool的内容加到messages里面,每次将所有的messages交给llm,生成下一个动作。感觉更接近WebResearcher文中的Mono-Agent形式
-
而不是WebResearcher文中正式提到的,以Think , Report , Action为核心,每次不涉及到历史的其它输入输出(也就是文中的马尔可夫)
我的理解是正确的吗?
同感,可能在模型内部?
同感,感觉这样的话上下文岂不是很容易超限
同感,感觉这样的话上下文岂不是很容易超限
108k的上下文窗口还好,跑了一些自己的数据集,基本上塞不满