Gjiji (@Gejigeji) 在（佬们，救救孩子）全自动AI编码存在普遍的测试不全面问题，各位佬是怎么规避解决的中发帖最近转全自动AI编码（立项后的：需求+设计+开发+测试+运维，全丢给AI），好处自然是能大幅度缩短项目周期，但是短板也很明显，各种功能的测试很不全面、或者说完全测不出来，导致项目上线后bug满天飞，客户恨不得半夜把我拿刀直接劈了…… 但即使我加强各种测试（单元测试、集成测试、e2e测试、场景测试等等），最后的结果依然不如人意：我一个简单的商品管理小程序，代码不过2W+，测试用例到后面补加到了2000+，覆盖率直逼93%以上，结果首页登录商品展示都有异常！很是无语！我用过了opus4.6，opus4.6 fast，opus4.6 MAX fast以及听说解bug能力最强的gpt-5.4，但是bug依然在，只要你不指出具体哪里有问题，AI绝不会排查到这里是异常的！（需求表述、测试规则都已经严格声明，创建的skill也是针对这类bug，可惜AI还是视而不见）总之，我快被这类小bug...

Gjiji (@Gejigeji) 在（佬们，救救孩子）全自动AI编码存在普遍的测试不全面问题，各位佬是怎么规避解决的中发帖

最近转全自动AI编码（立项后的：需求+设计+开发+测试+运维，全丢给AI），好处自然是能大幅度缩短项目周期，但是短板也很明显，各种功能的测试很不全面、或者说完全测不出来，导致项目上线后bug满天飞，客户恨不得半夜把我拿刀直接劈了…… 
但即使我加强各种测试（单元测试、集成测试、e2e测试、场景测试等等），最后的结果依然不如人意：我一个简单的商品管理小程序，代码不过2W+，测试用例到后面补加到了2000+，覆盖率直逼93%以上，结果首页登录商品展示都有异常！ 
很是无语！ 
我用过了opus4.6，opus4.6 fast，opus4.6 MAX fast以及听说解bug能力最强的gpt-5.4，但是bug依然在，只要你不指出具体哪里有问题，AI绝不会排查到这里是异常的！（需求表述、测试规则都已经严格声明，创建的skill也是针对这类bug，可惜AI还是视而不见） 
总之，我快被这类小bug...