欣 郁 (@user1164)Deepseek官网的联网搜索是否是一个agent系统?如何复刻? 中发帖

Deep Research一直有几个痛点: 

如何把问题拆分成搜索检索词
合适的搜索引擎
如何爬取网页内容
如何最终汇总(比如爬取的内容+汇总可能超过单个上下文窗口长度)

但是Deepseek官网的联网搜索,从去年年初刚上线就非常神奇:

动辄能搜到50+的网页内容
相对于通常其较短的输出,开网页搜索并提问复杂问题时,回答可以成为一个小Deepresearch

更不用说Deepseek V3.2已经可以多段网络搜索。
我看到开源的deep research方案,基本都用SERP+JINA/firecrawl这样的商业组合,非常贵——deepseek的api已经很便宜了,我觉得应该不是用商业化方案。
在我看来Deepseek内部必然有自己的搜索接口和爬虫,甚至可能还有rag技术(因为一次搜索到的内容太多了)
我很想知道如何复刻?
我真觉得deepseek官网的联网搜索方案是我...