@Jaxon-jp为什么没有人用 gpt-oss-120B 的推理链来蒸馏更大参数的模型? 中发帖

开源模型中,我认为就推理来说,oss-120B至今是第一,除了ds-R1能跟他扳扳手腕,就没有别的对手了