@noodle视频理解大模型 中发帖

佬们有知道哪些视频理解大模型吗?支持输出时间轴。 
Gemini是目前效果最好的,但是挺贵。
qwen2.5-vl微调效果一般,主要是输出时间轴不准确,不清楚是否和抽帧有关。