kejun (@ke_jun)250225 三花AI日报:Anthropic 发布 Claude 3.7 Sonnet ;Qwen Chat 推出“Thinking (QwQ)” 推理功能; Grok 3 推出国产模型难以超越的功能;DeepSeek 开源周首秀:高效 MLA 解码内核 FlashMLA 中发帖

DeepSeek 开源周首秀:高效 MLA 解码内核 FlashMLA
[图片]
FlashMLA 是由 DeepSeek 开发的一款高效的 MLA 解码内核,专为 NVIDIA Hopper 架构 GPU(如 H800 和 H100)设计。
昨天,该项目作为 DeepSeek 开源周的首秀推出。这款内核的灵感来源于 flash-attention,目前已经在 GitHub 上获得了 7.7k 的 star。
Qwen Chat 推出“Thinking (QwQ)” 推理功能
[图片]
Qwen 团队昨日宣布在 Qwen Chat 中推出全新功能“Thinking (QwQ)”,该功能由 QwQ-Max-Preview 模型提供支持,现已可通过 http://qwen.ai 访问!
接下来,Qwen 团队计划发布 QwQ-Max 的正式版本,并将 QwQ-Max 和 Qwen...