温州程序员劝退师 (@Das)【吐槽】大模型太强了,以至于很多人感觉自己行了 中发帖

[image] 
最近在搞 RAG,疯狂找文章、跑 demo。
结果越跑越觉得:这些东西完全没讲到点子上。
现在的 RAG 教程基本有个共同套路:

跟着官方示例走一遍 → 跑起来了 → 完事。

但真正关键的东西,全都没写到(或者不会)。
大多数教程的内容就是:
文档随便加载、chunk 大小照抄默认、top-k 恒定 5、embedding 不解释、检索不分析、不做 rerank、不做 query rewrite、不谈 evaluation、不讲 error case、不讲优化
最后整个系统确实能跑,但仅限于能跑起来。
真正难的地方,全都避而不谈,RAG 的痛点其实在:

chunk 怎么切才不会丢信息
如何减少噪声检索
如何做混合检索(BM25 + embedding)
是否需要 rerank
如何提升召回
多文档融合怎么做
用户问句要不要改写
最终回答怎么 gr...