StrayBirds 在 关于Gemini 2.0音频识别能力的测试 中发帖
刚才看到一个帖子谈到了大模型对音乐的理解能力,出于好奇去测试了一把。
先测试了两首歌曲:古典乐(随便找的),摇滚乐(Us and Them——Pink Floyd)。
[PixPin_2024-12-14_22-40-05]
[PixPin_2024-12-14_22-46-46]
[PixPin_2024-12-14_22-42-57]
[PixPin_2024-12-14_22-41-16]
从结果看来,跟上篇帖子大差不差,已经很优秀了。
这时,为了验证这样一个猜想:曾经的出版音频作为素材已经被训练进了模型里。于是测试了第三首歌,刚发行还没30天。
让我震惊的是,关于歌词故事中的隐喻,它完全听懂了!!!在这之前,我还以为这只是首讲俗套爱情的说唱歌曲,它抓住了线索,并串起了整个故事,我已经被它的理解能力震惊到了。
[61863c18c1c417ce8565b8708...