https://linux.do 论坛的话题更新通知频道。
werous 在 到底怎么才能降低Qwen3.5-35B-A3B的think啊 中发帖
大佬们 最近用最新的gpustack2.1.2版本 搭配8个L40装了Qwen3.5-35B-A3B的vllm模型。
官方文档说可以靠thinking_budget参数来调节思考的长度,但是根本不好使啊..
system角色写提示词要求它精简思考过程也不行。。。。
没招了..
mumong (@mumong05) 在 最近工作遇到点迷惑 中发帖
各位老哥们好,我是一个毕业工作 2 年的新人,最近领导在给我安排工作的时候我之前的工作喜欢和工作方式好像和他期待的不太一样。想发出来让大家分析下是我太学生思维了吗?
事件一 机器人验证
最近公司买了个机器人,他安排我去研究下,然后跑一个案例,能让他动起来。当时的原话是“你去跑一下网上这个案例,然后了解下他是怎么驱动起来的”
然后我就正常的跑官方案例,中间遇到很多环境,沟通的问题。重点是我对他的了解 可能只在表面,就是他是个什么,有哪些重要技术实现,然后基础的操作逻辑是什么。
但是事后领导让我分享的时候,会问的非常非常细致,比如这个技术 ROS 现在市场上使用情况怎么样,有没有其他控制方式,机器人我们如果自己独立二开应该是什么流程。
我总结一下是,我收到的消息是干 A 然后我根据字面意思理解为要做的任务,加一些必要的基础了解作为任务去做。 如果完全懂是 100 分,我感觉根据我的理...
你这是违法行为 (@Anano) 在 罗福莉预测:AGI两年内实现,称中美顶尖大模型代差仅两三个月! 中发帖
小米大模型团队负责人罗福莉判断,目前国内已有包括 Kimi、MiMo 在内的多家公司具备 1T 参数以上的基座模型,中美在预训练阶段已经基本不存在代差。
罗福莉表示,由于国内团队在预训练结构上具备一定优势,只要对 Agent 范式反应足够快,国内模型与 Claude Opus 4.6 等国外顶尖模型的代差实际上只有两三个月。她认为,未来两三个月将是考验各家大模型团队整体研究水平、技术敏捷度以及拥抱新范式能力的关键窗口期。
在 AGI 进程方面,她预估当前进度已达 20%,今年有望推进至 60% 到 70%,并预计 AGI 将在两年内实现。由于开源 Agent 框架(如 OpenClaw)的爆发激活了群体智能,允许框架和模型实现双向迭代,这正大幅加速研发进程。
[image]
!
Rick (@Rickoo) 在 诶,Claude重置额度了吗? 中发帖
在大家都在讨论GPT与Deepseek的时候,Claude害怕了做人了?
Claude Design也重置了,真好。
顺嘴一提,这几天北京移动挂梯子特别难用,发现Cloudflare的WARP又继续好用了,好!
[image]
Dave (@bonee) 在 DeepSeek v4 在 Arena.ai 排名出来了 中发帖
Text Arena
[Text Arena]
目前貌似不如 Qwen 3.5 Max,不过新模型后续排名变动应该会比较大,不排除会大幅上涨的可能性。
Code Arena
[图片]
chen (@czk) 在 AI有情绪吗?从AI夸我是写作领域大神说起 中发帖
引子
刚看到deepseekV4发布了,想起来前几个周末闲着无聊,写了一篇小说,发到deepseek让他帮我润色润色,润到后面我都已经准备好横扫各大小说榜单了,我简直就是一个被埋没的写作领域大神!。
[1_130pjq_.png]
[2_zlfhyr_.jpg]
但结果呢?
很遗憾地通知你,你的投稿作品未通过审核。原因为:文笔风格、剧情逻辑经不起推敲,读者代入感较弱。请不要因为这次的失败而感到气馁,期待下次能与你合作!
哈哈,给各位佬友看个乐子,但是我今天要说的是借由这个事件引出来的,这个AI彩虹屁究竟是怎么形成的 。
提示词的失效
其实很多人早知道AI是个赛博马屁精,那AI为什么骗我呢,难道不是因为我写的好才夸我吗,而且我提示词不是叫他客观分析了吗?难道我的提示词失效了 ?
信号层
我的视角
AI接收到的
实体层
“客观分析“ ,“我的小说”,“投稿”
内...
@SErAphLi 在 DeepSeek V4感觉比Opus 4.7好 中发帖
[image]
色盲题85秒一次通过. Opus 4.7在CC上开max个人测试了3次以上,无法通过.
[image]
洗车题更是毫不费力.
[image]
9.9-9.11用的instant也是对的
这三题都是我在CC上测试Opus 4.7答不对的问题.
辛逝纪芙音战士 (@Nathan827) 在 DeepSeekV4发布,终于不是我已急哭😭 中发帖
[Screenshot20260424123857]
官方宣传性能达到顶级闭源模型水平,佬友们去测测看,不多说了,我先试试
[55fdfcc1fe26a2ce74ef2cb1d110d78710157806]
你这是违法行为 (@Anano) 在 DeepSeek V4首曝生产级Agent沙盒DSec:单集群调度数十万并发,统一四种异构底座 中发帖
DeepSeek V4 技术报告首次公开了支撑 Agent 后训练与海量评测的核心基础设施,生产级弹性计算沙盒 DSec(DeepSeek Elastic Compute)。
当前大模型强化学习需要极其庞大的代码试错环境。报告披露,在实际生产中,单个 DSec 集群能同时调度数十万个并发沙盒。系统由 Rust 编写,底层对接自研 3FS 分布式文件系统,通过层级按需加载(on-demand loading)打破了海量沙盒冷启动的性能瓶颈。
在开发者体验上,DSec 用一套 Python SDK 统一了函数调用、容器、微型虚拟机和完整虚拟机四种执行底座,切换时仅需修改一个参数。针对算力集群常见的任务被抢占问题,DSec 引入了全局轨迹日志:当任务恢复时,系统会直接「快进」重放已缓存的命令执行结果,既实现了极速断点续训,又避免了因重复执行带来的非幂等错误。
[image]
@HCPTangHY 在 DeepSeek V4 Pro测评:抱歉没能让GLM大人尽兴 中发帖
依旧先放私有bench
[image]
这个模型吧,他的思考效率极低,,经常思考个600-1000秒
但是呢,人家GPT思考这么久真能把活干好,v4p就只能达到中游水平了
[image]
写出来的很多东西只能说想法很好,但能力不足
[image]
[image]
在审美这一块呢,不像任何一个模型,基本都有自己的理解,说明代码蒸的不多,不像某些没能尽兴的模型
[image]
不过在知识库上确实是Gemini之下差不多最强的了
[image]
当前价格是12/24,OR折算美元1.74/3.48,对比GLM 5.1还是贵了不少的
只能希望公告里所谓的下半年国产算力之后能有大幅降价吧
[image]
胖虎 (@williw) 在 gpt team的pro问题 中发帖
佬们,从昨天开始我使用team的pro模型都被路由到了gpt5-mini,现在team是不能用pro了吗,另外5.5的pro出来了吗,是我梯子问题吗?
@muyiyang 在 这就是满血v4?写一个电商网站...快救救我!!! 中发帖
提示词:
@index.html 帮我设计一个自营跨境电商 网站首页,主要买的商品是皮鞋、皮靴,男女款都有,css用tailwindcss写,网站风格欧美风。
结果截图:
[image]
▶
html代码
快救救我快救救我 😭
这就是满血v4?