凌封小子 (@fengin)Fun-ASR-Nano-2512 Linux 部署指南,捣鼓了两天,直接写成脚本了 中发帖

Fun-ASR-Nano-2512 是通义实验室推出的端到端语音识别大模型 Fun-ASR 的轻量化版本。Fun-ASR 是一款功能全面的语音识别基础工具包,集成了自动语音识别、语音活动检测、标点恢复、语言模型、说话人验证、说话人日志记录以及多说话人语音识别等多项核心功能。轻量化版本 Fun-ASR-Nano 参数量 0.8B ,推理成本更低,支持本地部署与定制化微调。该模型基于数千万小时真实语音数据训练,支持低延迟实时转写与 31种语言 识别。核心特性包括远场高噪声场景深度优化,识别准确率可达 93% ;支持吴语、粤语、闽语、客家话、赣语、湘语、晋语 7大方言 及河南、陕西、湖北、四川等 26个地区口音 ;强化音乐背景下的歌词识别能力;引入 RAG 机制将定制热词上限提升至 10000条 ,满足金融、医疗、教育等专业领域需求。 
版本发布后,正好我这项目要用到,第一时间进行了部署调试,部...