温州程序员劝退师 (@Das) 在【吐槽】大模型太强了，以至于很多人感觉自己行了中发帖[image] 最近在搞 RAG，疯狂找文章、跑 demo

温州程序员劝退师 (@Das) 在【吐槽】大模型太强了，以至于很多人感觉自己行了中发帖

[image] 
最近在搞 RAG，疯狂找文章、跑 demo。 
结果越跑越觉得：这些东西完全没讲到点子上。 
现在的 RAG 教程基本有个共同套路： 

跟着官方示例走一遍 → 跑起来了 → 完事。 

但真正关键的东西，全都没写到（或者不会）。 
大多数教程的内容就是： 
文档随便加载、chunk 大小照抄默认、top-k 恒定 5、embedding 不解释、检索不分析、不做 rerank、不做 query rewrite、不谈 evaluation、不讲 error case、不讲优化 
最后整个系统确实能跑，但仅限于能跑起来。 
真正难的地方，全都避而不谈，RAG 的痛点其实在： 

chunk 怎么切才不会丢信息
如何减少噪声检索
如何做混合检索（BM25 + embedding）
是否需要 rerank
如何提升召回
多文档融合怎么做
用户问句要不要改写
最终回答怎么 gr...