啊天 (@louishino0524)豆包手机的实现速度 中发帖

豆包或许最主要的 OCR 是端侧的。比如一个做题流程,它有可能最开始先把整张截图上传到云端,云端返回的只是文字区域的位置信息,还有按钮位置的信息。题目的 OCR 是本地进行的,对云端可能只上传按钮位置的变动等信息。这样一套组合拳下来,就可以做到非常快。