啊天 (@louishino0524) 在 LLM很多应用场景都会降低效率,目前架构不大改的情况下,别再用它搜教程了! 中发帖
使用 LLM 或许只会降低效率
哪怕这个领域或者问题有一点时效性,比如你使用一个软件,但是这个软件版本近一两年还在更新,那现行的 LLM 指导你使用软件的时候总会出现问题,因为过去的教程等等权重肯定比最新资料文本的少量资料权重大,这还是考虑到 LLM 已经更新最新的知识库情况,经常能让你抓狂,发现很多指令已经用不了了。
而且基于当前的架构,大模型大就大在他们就是基于几乎整个互联网史训练的,只使用最新数据训练可行吗?比如说只使用 2025 年新产生的网页(注意,这可和 2025 年存在的网页不一样,2025 年存在了大量的 2023 年写的教程,然后又被 2025 年某个镜像站新产生的甚至失效的教程,甚至用 2025 年新产生的网页也绝对不算完美)训练可行吗?那必然不可行,数据量不够,可能这模型基本问题都无法解决,于是这样一头筋变两头堵了。
这问题只能用微调大模型,或者引入新 prom...