Schrödinger (@synbio) 在 OpenAI 开源模型配置短暂在线发布 中发帖
available as 120b (gpt-oss-120b) and 20b (gpt-oss-20b) variants
提供 120b (gpt-oss-120b) 和 20b (gpt-oss-20b) 两种变体
120-billion-parameter GPT-OSS model configuration highlights
1200 亿参数 GPT-OSS 模型配置亮点
use of Grouped-Query Attention (GQA) to balance efficiency and quality for cost-effective inference
采用分组查询注意力 (GQA) 以平衡效率和质量,实现经济高效的推理
36 layers and a 4096-token context length, reflecting ad...