@yxp934逆向复现augment ACE进展与求助! 中发帖

如题,augemtn的AceTool 开始收费了。我查阅了一些已有的方法,以下是目前的一些拙见,我希望能和愿意动手的人一起,把它背后的思路拆开、跑通,最后做出一个可复现、可替代的开源方案。  我自己能力有限,看到这的佬们,如果有推荐算法、大模型岗位的经历,刚好也对代码检索/代码索引感兴趣,请私信我,一起把这件事推进下去。 
以下是正文:
从augment的博文描述来看,它大概率用了自研的 embedding 模型,对代码的逻辑关系处理得更好。它的代码索引 API 几乎是瞬间返回,而且能细到行号级别,因此我推测它的做法是先把代码切chunk,再对 chunk 做 embedding 并建立索引。
但这条路线如果直接用通用 embedding 模型,几乎很难达到同样效果。
站内有佬复现了ace,[开源] ContextWeaver 本地代码库语义检索工具,目标是ace平替 ,基本上可以平...