最上川 (@artorius) 在 TII刚刚发布了Falcon H1R-7B模型 中发帖
TII刚刚发布了Falcon H1R-7B模型
一种新型推理模型,仅凭70亿参数和25.6万字节上下文窗口,便在数学和编程领域超越其他模型
该模型融合了Mamba与Transformers架构,因此在吞吐量和内存效率方面更具优势
[image]
官方介绍:Introducing Falcon H1R 7B
Hugging Face:Falcon-H1R - a tiiuae Collection
[image]
😋热乎的喵,最新小模型好多哇