@Cym2925求佬友们推荐视频视觉大模型(需要返回坐标) 中发帖

在弄视频识别,提取出一些特定行为(车祸碰撞)和一些对象(例如信号灯,小车)的坐标框的项目,有什么模型识别效果好而且可以返回坐标范围吗?我现在用的qwen3.5plus经常识别不出来“碰撞”