https://linux.do 论坛的话题更新通知频道。
你这是违法行为 (@Anano) 在 华为芯片拖慢DeepSeek V4上线?同一内核通吃英伟达昇腾还加速近2倍! 中发帖
DeepSeek V4 发布前,社区广泛流传一种猜测:V4 上线时间晚于预期,是因为模型从英伟达迁移到华为昇腾平台遭遇适配困难。V4 技术报告虽未直接回应这一传闻,但披露的性能数据与之明显矛盾。
报告显示,V4 的细粒度专家分区方案(Fine-Grained EP Scheme)已在 NVIDIA GPU 和华为昇腾 NPU 双平台完成部署验证,常规推理负载加速 1.50 至 1.73 倍,RL rollout 和高速 Agent 服务等延迟敏感场景最高加速 1.96 倍。团队已将 CUDA 版本内核 MegaMoE 作为 DeepGEMM 的一部分开源。换言之,V4 在两套硬件上都跑出了接近理论上限的效率,跨平台适配并未造成性能折损。
[image]
zoenoa 在 一张531790卡头的0刀卡,还有30多分钟 中发帖
@AlexFox 在 DeepSeek V4 Thinking Max+OpenCode小功能代码测试 中发帖
用DeepSeek V4测试了一下代码能力,让它给我的一个后端项目加个RSS功能,实测下来感觉还不错,能很好的理解项目架构(也有OpenCode的功劳),做出的改动符合当前项目架构,没有出现写屎山或者自己造轮子情况,不过没有自行生成单元测试,gpt的话大部分时间会自动生成单元测试。就是价格上有点小贵,直接用的官方API,后台显示花费4.98元,总Token为1533274 token,输入(命中缓存)1245696 token,输入(未命中缓存)263792 token,输出23786 token
初雨荷 (@Chuyuhe) 在 cpa反代codex 5.5怎么开启fast模式 中发帖
我平常是在codexapp里使用的自己的cpa服务器,之前5.4时期就有配过。
当时看到有佬友说config.toml中加入service_tier = "fast"然后在cpa中的payload中加入如下配置就行
[image]
不知道现在是否还能这样配置
这是我目前的codex配置
[image]
btw:codexapp里只能显示自定义模型而且上下文窗口好像只有258k
[image]
VIAOTO (@1392726643) 在 codex windows app 新版本浏览器使用功能 中发帖
[PixPin2026-04-2412-57-38]
在新版本设置中发现了浏览器使用,但是似乎无法使用
lucas (@lucasli) 在 deepseek定位的一些分析 中发帖
大家有称赞有批评,批评主要集中在coding不是很突出上,但作为国内爆款模型,大部分的user还是集中在QA和世界知识上,而不是coding,也就是说他们想做的可能是一款平民称赞的模型,而不是类似于glm的coding model ?
Alva (@asjun2lin) 在 DeepSeek V4 的相关影响 中发帖
deepseek v4 的推出,应该对相关同行有着不小的影响。简单的像其他家的ai也要有1m上下文了啥的。光是对昇腾gpu的支持,就能把老黄逼急(前不久采访提到的不该限制gpu卖给中国的言论)。
光从模型看,哪怕公众号文章提到的性能有所差距
“目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距”
对 A\ 应该也会有些政策上的影响吧?(2%的pro订阅不允许使用 claude code)。
至于 codex,最近已经可以说是开始做人了。不仅最新的 5.5 开始说人话,而且还在不断重置额度
一梦浮生 (@gooker) 在 有没有对比dsv4p和mimo2.5p,不想用qwen3max了 中发帖
目前在使用qwen3max内部测试用,打算换了,一个是上下文长度不够,另一个应该是有些情况理解能力还是不够.
想选一个,1m上下文,暂时没有多模态需求,目前看dsv4p和mimo2.5p, 但是没有对比测试.
或者挖个坑,有对比大家 发一下
LLZ (@user321) 在 DeepSeek v4pro你也太吓人了吧!!! 中发帖
[screencapture-file-C-Users-Lizili-Downloads-AI-2026-4-23-html-2026-04-24-123825]
[9f00572636ca850b53c6300634863722]
[dea495e749845ef834cd2d56fa0893c0]
简单玩了一下
·读了20篇论文写了一个报告,做了一个思维导图和html文件
·问了一个“构建一个 flatpak 包,构建过程中某个命令发生了 DNS 解析失败,有可能是什么原因?”的问题
·写了一个如图的html文件
然后就欠费了。
(如果我不交会封号或者打电话发短信催我缴费吗?) 🙃 🫥 🫣
😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭😭
@sallyn 在 通用焚决千篇一律,特殊风格万里挑一 | 一些非大流二次元向自用Prompt合集 | 一些自制焚决的思路 中发帖
写在前面
GPT-Image-2 也出了有一段时间了。从一开始制作各种IP的联动图,到使用各路大神写的焚决,也算是把这个模型的能力体验的七七八八了。
但是同样的主题和同样的焚决看多了,加上大家用的都是一个模型,所以很多时候看到一张图,就会想“哦这是GPT做的 真好看啊”然后就忘了。
其实这个道理和前端也是一样的,如果让我回到过去一两年前,看到AI能做出一个还可以的蓝紫渐变网站那会,我可能会觉得还不错——但是时间长了千篇一律的设计风格看多了难免有些乏味。现在的 GPT-5.4 在这上面的缺陷就很大——衬线体大字hero标题、卡片堆砌、无意义的说明文字。如果是乍看一眼我会觉得还行,但看多了确实没意思。
因此在用了各种焚决之后,我打算从 Pinterest 以及 X 上的各种插画参考,自己写不曾在 GPT-Image-2 中看过的设计风格。
先来几个例子
[!attention] 这是...
猫猫团子 (@Kuhlman_Trever) 在 人闲着就是吃吃吃 中发帖
按理来说,早上是一点都不饿的,今天只吃一顿晚饭应该就够了,还是点了一份麻辣拌,现在吃完又后悔
我也知道自己不饿就单纯的不知道该干吗?只能吃吃完了又难受,不吃也难受
也没法去上班,也没法去上学
哈,这日子就这么痛苦过下去吧