@purr 在 MMSearch 结构化流程搜索引擎 复杂图像查询超越 Perplexity Pro 中发帖
斯坦福团队近日发布了一款名为 MMSearch Engine 的搜索引擎。使用流程化图片查询,在配合 4o 等模型的情况下能够接近或超过 Perplexity Pro 对于图片的查询能力.
[teaser]
MMSearch 本身也是一个对于模型图片理解能力的 benchmark, 其中 4o 第一,4v 第二,sonnet 3.5 第三. (那个排行榜感觉差点意思,总觉得不是所有模型都被包括了,建议源代码自行测试)
[image]
论文主页/排行榜
源代码
PS. 感觉是能用 Dify 等其他流程图项目复刻出来的说,等一手佬