黯绛 (@amlkiller) 在 手机端侧AI框架主观评价 中发帖
RT 今天刚尝试各个框架,在oneplus13T 16G+1TB 下测试。
由于各个框架之间模型文件差异太大就只能以同参数下模型来比较了,量化尽量保持Q4_k_M。
以4B模型来比较,8B模型基本平衡能力和速度。
[image]
第一个是来自Google的liteRT 前端 Google AI Edge Gallery
仅支持30个模型,其软件内置推荐下载的模型就是最高水平了,gguf转换其框架模型文件遭遇失败。
图中是gemma3n-E4B
唯一支持使用GPU来运行模型,但似乎水土不服内存溢出。
支持多模态,速度也在合理水平。
优点:效率高,速度快,多模态,颜值高
缺点:模型数量少,实验性应用支持不完善
[image]
第二位是来自阿里的MNN框架 前端MNN Chat
支持国内外较多模型,Qwen全系,ds的蒸馏模型和一些视觉模型都有。
多模态支持完善但功...