bfloat16豆包手机还挺有意思的 中发帖

老戴那个视频里面没看模型推理部分,纯好奇就自己拆了一下固件 
[PixPin_2025-12-12_01-05-45]
看来是把python脚本用cython编译到native,然后由python解释器执行,调用Qnn去跑推理:
https://docs.qualcomm.com/doc/80-62010-1TC/topic/qnn.html
端侧模型还挺全:bert,clip,ocr,text_embedding
[PixPin_2025-12-12_01-08-16]
还带了2b参数量的多模态(?