@Dr.X 在 Deepseek 的蒸馏模型如何去掉思考过程 中发帖
拿来翻译有点慢,但是 deepseek 微调的 qwen 模型数据库应该挺不错的,如何让它不思考,只输出结果。会对结果产生什么影响吗?有没有大佬解答一下
拿来翻译有点慢,但是 deepseek 微调的 qwen 模型数据库应该挺不错的,如何让它不思考,只输出结果。会对结果产生什么影响吗?有没有大佬解答一下