https://linux.do 论坛的话题更新通知频道。
@yushim 在 建议把回复的子回复放到boost前面 中发帖
就比如这个回复,50个boost把半个屏幕占满了,这时我想看这条回复的两个子回复,点了一下没反应,我还以为出bug了,往下滚了半页才发现子回复在50个boost下面呢
我既然点击了子回复,肯定是想看子回复,这个逻辑可以优化一下
[image]
[image]
时雨雪 (@shigure_yuki) 在 是否存在能真正“理解”音乐的多模态ai? 中发帖
如题,鞭策ai写东西的时候听歌突然想到这个问题,想通过AI去学习乐理;站内搜索发现gemini 2就已经能听懂音乐了,然后照猫画虎上传了个音乐给3pro听。
[image]
结果就是人声部分确实能识别出来而且识别准确率很高,但是时长对不上,尝试问乐器solo部分也回答不上来,应该是忽略或者去掉了乐器独奏的部分。
[image]
[image]
然后想起来qwen3.5有全模态的模型omni,也尝试着去用了一下(上传歌曲有三分钟的时长限制)
[image]
[image]
体感就是乐器部分识别明显准确了,歌词识别和gemini五五开,时间轴比较准,没有gemini那样错漏。
所以回到标题,“是否存在能真正‘理解’音乐的多模态ai”,这个问题我依旧拿不准,所以想请教一下有经验的佬友。
Mci77777 在 ai戒断,现在的gpt 和当初使用Claude 如出一辙啊.大家用一下国内的进行一下戒断 中发帖
古法编程戒断一下好不好.
使用gemini/glm/deepseek/minimax cursor compose 模型进行一下调解.
现在就像瘾君子.
[image]
linjinpeng 在 对于御三家和片王的评价 中发帖
gemini像文科生,论创意和画图能能力排第一;gpt像理科生,推理能力最强,后端无敌;
claude典型工科生,超级生产力唯一选择;
至于grok,我现在片都懒得自己搜了,直接问他 :tieba_013:
邓觉眠 (@Juemian) 在 有创业想法的博士和研究生或者92本科生请加我 中发帖
我现在在创业,如果你有兴趣,我们可以一起去创业去路演打创赛,如果你可以推荐导师、企业老板、以及有意向一起合作的同学,我也会十分感谢你。(我的项目的地址见我其他帖子,我不知道这里怎么样发联系方式。)
我简单介绍一下现在的系统功能:
第一个功能是传统设备的低成本 AI 升级包’。只要塞进一块极其便宜的芯片,就能让原本只会死板运转的哑巴设备拥有防错门禁、自主决策和听懂业务指令的‘离线大脑’。它让设备彻底摆脱断网风险,可以进行本地决策,比如说可以做预警告警、故障判断、处置建议、安全拦截和协同维修:也就是能够降低维修成本,预警告警避免出现机器故障,规范工人行为,协同师傅维修提高处理速度。
应用场景:工业机器;野外、特种装备(比如说矿井设备,远洋无人艇,农业灌溉网关,电网电池);智能家居和安防领域(门禁,家庭储能控制中枢);还有什么银行自助机之类的场景,医疗与康养设备(比如说心电仪的生命体征的上...
ziyuhaokun 在 这是一个极度缺爱的人的一段情感自述 中发帖
原本我以为 L 站只是一个分享计算机相关知识、交流最新科技动态的论坛。
没想到这里居然还有这样情感细腻的小角落。
所以,如果您愿意停下来,倾听我的故事,我将万分感激。
---------------- 分割线 ------------------------
见字如面,遇笔知心
2021.06.02 我们成为了朋友莫西莫西,我是子遇。我是乔安。
半年后的某天:
“当初为什么会玩在一起呀?”“想找一个人陪着,一起玩游戏,我以为你不会嫌弃我。”结果每一把咱们都秒倒。hhhhh
我懵了,一看到监管就慌了神。
后来呢?
后来啊,小王子季节开始了。你带着我入了光遇的坑,陪我拿了每一个先祖、光翼和烛火。
[Pic (3042)]
但,即使如此,我们的交际并不多吧。彼时的我也没想到,你在未来对我有多么重要。
[Pic (3602)]
2021.08.15 那天我们吵得...
MoeCaa 在 来点好玩的模型svg对比 中发帖
今天在搓三方tg客户端 (刚刚开始弄,就改了包名api名称,还没改功能),突然想让ai设计个logo试试,正好对比下不同模型的风格习惯和svg设计能力
使用的提示词
提示词很简单,尽可能让模型自行发挥
提示词1
我要做一个叫做Flexgram的app(3rd telegram),帮我设计一个svg logo
版本2(实在受不了默认审美于是补充了下要求)
我要做一个叫做Flexgram的app(3rd telegram),帮我设计一个svg logo 少点渐变 浅色 可爱风格
使用的模型(均为网页版)
Claude Opus 4.6 thinking
Claude Sonnet 4.6 thinking
Gemini 3.1 pro
Gemini 3 flash
Grok Expert(免费版的 显示4.20但是应该不是)
GPT 5.3 Instant
GPT ...
🦖 (@yangzhe_mark) 在 FluxDO会不会支持看Boost啊? 中发帖
目前我查了一下我已经是最新版FluxDO,但是好像是看不到boost的(虽然功能今天才新出),但是想看到boost只能在手机网页版了,而且我只在FluxDO配置了DHO,网页端还得开🪜,FluxDO什么时候会更新看boost啊🥲(没有催的意思)