Gjiji (@Gejigeji)(佬们,救救孩子)全自动AI编码存在普遍的测试不全面问题,各位佬是怎么规避解决的 中发帖

最近转全自动AI编码(立项后的:需求+设计+开发+测试+运维,全丢给AI),好处自然是能大幅度缩短项目周期,但是短板也很明显,各种功能的测试很不全面、或者说完全测不出来,导致项目上线后bug满天飞,客户恨不得半夜把我拿刀直接劈了…… 
但即使我加强各种测试(单元测试、集成测试、e2e测试、场景测试等等),最后的结果依然不如人意:我一个简单的商品管理小程序,代码不过2W+,测试用例到后面补加到了2000+,覆盖率直逼93%以上,结果首页登录商品展示都有异常!
很是无语!
我用过了opus4.6,opus4.6 fast,opus4.6 MAX fast以及听说解bug能力最强的gpt-5.4,但是bug依然在,只要你不指出具体哪里有问题,AI绝不会排查到这里是异常的!(需求表述、测试规则都已经严格声明,创建的skill也是针对这类bug,可惜AI还是视而不见)
总之,我快被这类小bug...