LINUX DO Channel
06:11 · Jun 13, 2025 · Fri
@noodle
在
视频理解大模型
中发帖
佬们有知道哪些视频理解大模型吗?支持输出时间轴。
Gemini是目前效果最好的,但是挺贵。
qwen2.5-vl微调效果一般,主要是输出时间轴不准确,不清楚是否和抽帧有关。
Home
Powered by
BroadcastChannel
&
Sepia