zlxie微软正式发布Phi-4模型,GPQA达到56分 中发帖

Huggingface链接:microsoft/phi-4 · Hugging Face 
Reddit上的相关讨论:https://www.reddit.com/r/LocalLLaMA/comments/1hwmy39/phi4_has_been_released/
各种benchmark的得分:
[image]
很震惊这么小的模型GPQA居然有56分,之前在哪看过一个说法,GPQA超过60就能明显感觉智能水平有个飞跃,有用过的佬友说说日常任务表现怎么样吗?