https://linux.do 论坛的话题更新通知频道。
🍉 (@white_goose) 在 【求推荐】想入门 OPD训练,求一条适合零基础强化学习的学习路线 中发帖
自 DeepSeek-V4、Qwen3.6 发布以来,On-Policy Distillation(OPD)的热度一直很高。最近看到很多博主都在介绍这种训练方法,所以也想找一个合适的项目入门,系统学习一下这类模型训练流程。
一方面是为了学习新技术,另一方面也是希望未来找工作时,简历上能够比较扎实地写一句:熟悉强化学习相关的模型训练方法。
个人基础
目前我的基础大致如下:
有传统深度学习基础,了解 CNN、RNN、Transformer;
有一定 LLM 基础、SFT 微调基础;
对强化学习基本属于零实操经验;
大致了解 on-policy、off-policy、模型蒸馏的基本概念;
粗略了解 GRPO、DPO、PPO 的基本原理,但没有实际训练经验。
对于强化学习中比较复杂、抽象的公式,我目前兴趣不算特别大,更希望先从“怎么训练、怎么落地、怎么做项目”的角度入门。
现在的状态是...
@liucola 在 佬们,被骗之后,通过某鱼找到了联系方式 中发帖
从之前某鱼找到了姓名、手机号、身份证号、地址,该如何办
还不敢和母亲讲这个事情
https://linux.do/t/topic/2007197
L.y 在 佬友们海思电视盒子刷机Linux系统有没有懂得,自己捣鼓废了 中发帖
[2a86fc4aa75b8c94ab57bc74f5abb889]
佬友们海思电视盒子刷机Linux系统有没有教程,听AI的自己捣鼓废了现在成砖了还有救吗,有没有懂这个刷机的神佬,现在的状态是开不开了,能显示亮灯,但是是黑屏
[3eda4b68145c93c2f4e324ea9256a640]
千手扉间 (@user2151) 在 codex又重置周限额么 中发帖
早上看我的周限额是0429才能重置,刚刚看到论坛帖子很多佬友被封号,随后去刷新了下cpa,发现周限额又满了
最后有问题请教一下佬友们,plus的生图额度一天是多少张吗?
[image]
比特 (@ballen) 在 GLM又偷偷改文档5.1限时一倍到六月底 中发帖
前沿慢讯,dp4上了以后GLM感受到压力了是吧
我记得之前这个图显示是活动持续到四月底,这会到六月底了
所以根本不缺算力,只不过是特色文化
[image]
yunan 在 win11桌面美化(极简版) 中发帖
效果图
[image]
一、前期准备(必看)
软件下载
Wallpaper Engine(简称 WE):Steam 官方购买。
Windhawk(简称 WH):官网免费下载(Windhawk Win11 全版本。
电脑基础要求
显卡:支持 win 10 及以上(大部分笔记本 / 台式机都满足),避免 WE 动态壁纸卡顿。
内存:建议 8G 及以上,同时运行两款软件无压力,低配电脑可关闭部分特效。
提前备份:桌面重要文件建议转移到 D 盘 / 其他磁盘,避免美化过程中误删。
二、第一步:用 Wallpaper Engine 打造动态 / 静态高级桌面
Wallpaper Engine 的核心作用是替换桌面壁纸,支持动态、静态、交互式壁纸,兼顾美观和流畅度。
1. 壁纸选择与设置
打开 WE,左侧点击「创意工坊」或「已安装」,选择自己喜欢的壁纸。
筛选可抄作业:
...
tdwhere 在 大家github的项目都是怎么推广的?是自己发小红书什么的么? 中发帖
想知道大家自己搓了项目,都是怎么推广的?是发在小红书什么的社区里面,自己去推广么?感觉那些大佬带火的项目好像也都是社交推广的结果。
Hellom 在 我怀疑Gemini改了次数? 中发帖
我记得学生会员,每天是100次pro对话吧,才会弹出用量超额重置时间,以往一个号使用,都是下午才出验证,今天2个号,到现在都出了重置时间。
哈吉米网页端,我喜欢问他问题。
ChenLuo 在 讨论下,DeepSeek还能给大家带来怎样的狠活 中发帖
DeepSeek发布有几天了,又是限时优惠二五折,又是缓存永久一折,今天又把二五折的优惠续到了五月底。
理性讨论下,DeepSeek后续的价格策略和模型能力还会有什么样的变化?
问题 1:优惠期到底有多久?
5月31正常结束优惠
再多来两个月
无限连续直到公告正式价格就是3/6
问题 2:优惠期结束后的价格会是多少?
恢复原价12/24
略有降低8/16
打个对折6/12
什么优惠期?哪有优惠期?3/6就是正式价格好不好?
问题 3:预期的下半年降价后的价格会是多少?
半价促销6/12
这就是原价!3/6
梁圣:我的恩情是没有上限的,我还能更便宜!
问题 4:现在的v4还是预览版,正式版会提升哪些方面呢?
我还能更快!TPS再提高一点
思考长度减少,但输出质量不变甚至有提升
编程特化提升,给大家来点小小的震撼
𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷 (@lezishen) 在 DeepSeek-V4 技术报告公开作者名单,多位核心骨干离职去大厂 中发帖
[image]
[image]
[image]
DeepSeek-V4 技术报告公开作者名单,多位核心骨干离职去大厂 - IT之家
@JayLi1024 在 各位有对AIGC有深入体验和了解的么 中发帖
这两天准备期末考试了,but导员说今年我们人工智能学院要扩招所以要用AI生高质量视频,特此问问目前有哪些好的生成方式,是智能体还是工作流,成本大概有多少。
这次五一我打算搓一个视频,也算是为了成立伊始的学院尽一份绵薄之力了
L.y 在 【投票】大家现在都在用什么AI啊那个更聪明一些 中发帖
去年十月到今年二月这期间一直在重度使用谷歌的Gemini Pro3.1模型,期间体验非常不错,但是越往后发现谷歌这模型越笨,思考时间越来越短上下文记忆也大不如前,智商堪比小学生豆包。
之后我就开始重度使用反重力因为反重力相比网页版的感觉更好用且不会降智,近期发现反重力也不好使了问他问题疯狂给弹Retry,感觉现在像是被折断了双臂一样没有一把趁手的工具了,Claude code封号太变态被封了一个号就不想和他玩了
个人感觉谷歌变笨的主要原因可能是后来逐渐低价大量pixel会员导致的市场大量泛滥,给谷歌的服务器算力被薅秃噜皮了吧。
以上仅为个人见解,欢迎佬友们评论区谈论
所以佬友们你们现在都在用什么AI那些模型更聪明些呢?(支持多选投票)
投票