https://linux.do 论坛的话题更新通知频道。
IfElse (@user269) 在 DeepSeek-V4-Pro Benchmark简单解读 中发帖
跑分对比表
加粗为该行最高分。
| 类别 | 基准测试 | 指标 | 测什么 | DS-V4-Pro Max | DS-V4-Flash Max | Kimi K2.6 | GLM-5.1 | Opus 4.6 Max | GPT-5.4 xHigh | Gemini 3.1 Pro High |
|—|—|—|—|—|—|—|—|—|—|—|
| 知识与推理 | MMLU-Pro | EM | 57+学科通用知识广度 | 87.5 | 86.2 | 87.1 | 86.0 | 89.1 | 87.5 | 91.0 |
| | SimpleQA-Verified | Pass@1 | 事实性问答,检测幻觉 | 57.9 | 34.1 | 36.9 | 38.1 | 46.2 | 45.3 | 75.6 |
| | Chinese-SimpleQA | Pass@1 | 中文事实性...
Infinity4B 在 在claw cloud run跑路之前,重新部署了cpa和metapi,体验好了很多 中发帖
看到消息说claw cloud run跑路了,之前把cpa部署在上面,metapi部署在我自己的vps上,用起来总感觉卡卡的。正好看到站里有讨论用Zeabur了,索性把服务都迁到Zeabur上,感觉神清气爽了,调自己的cpa首字1s内,调其他公益站也快很多。
ITSource 每日分享 (@itguang) 在 求教万能佬友:怎么拦截一个 url 返回我自定义的 JSON 数据 中发帖
背景:
有一个 url: http://www.example.com/test
接口返回了一个 JSON;{“hello”:“hello”}
这个域名和服务都不是我的,我想拦截本机请求这个地址的请求,返回一个我自己的 json,请问可以实现吗,有哪些现有方案可以提供
曹儒士子 (@guis) 在 codex 额度不够用啊, pro 一天花了 40%的周额度 中发帖
兄弟们,太难了… 还是得 codex 和 Claude code一起用。
之前从来没考虑过token消耗,昨天是开了它的 fast 模式,但是感觉这也太快了。今天只能抠抠搜搜,这感觉,差劲极了。。
[image]
Lonely 在 【公益预告】发件API服务-CuzEmailService 中发帖
这几天开通了CF business,然后有Email Sending权限了
如图
[Screenshot20260424163418]
那么下一个就做发件公益吧~😋😋
名字暂定Cuz EmailService
投票
本文纯水和聊天,没有任何推广成分。
kino (@kinoaaa) 在 吐槽deepseek 中发帖
调用官方的deepseek-chat api 接口跑agent实验,跑了一上午发现怎么调用了一千多次deepseek-v4 flash,原来直接把deepseek-v3.2替换了 😇官网貌似已经不支持deepseek-v3.2了。。。。。。
神操作,代码调用的模型没改,模型提供商偷偷把模型换成了更好的模型->实验白跑-> 🤡
一梦浮生 (@gooker) 在 简单试了长文本提炼deepseek 中发帖
从docx转markdown的长文本提炼数据,
数据txt形式,测试是网页..
对比千问max3(3.6),小米mimo 2.5pro,要求保留格式
ds是唯一把多个\n保留的,使用flash快速效果比带思考的好一些(带思考的会过度思考多出来超出预期的)
qwen和mimo对\t处理不好,mimo速度快(网页上没有不思考的..),
qwen以前还遇到过一直输出的问题做了提示词限制.
所以对ds还是有些惊喜的,接下来用flash处理,快,效果还不错