arch 在 为什么技术人讨厌“静默失败”?从王志文谈“老实人”说起 中发帖
王志文有句话最近很火:跟老实人一起,除了表面老实愚钝,更让人痛苦的是从来不会主动去想办法解决问题。
这话听着像情感鸡汤,但如果我们用系统架构的视角去审视,会发现这简直是一场灾难级别的技术事故。
我们很多搞技术的,容易陷入一个误区:觉得不惹事、运行稳定、在线率高就是好服务。但实际上,这种被动的老实,往往是掩盖系统崩溃的元凶。
这种老实人架构是不可维护的
1.静默失败比直接报错更可怕
在一段关系里,如果一方总是回避冲突、沉默应对,这在分布式系统中对应的状态就是节点无响应。你发出了一个请求,对方既不返回成功状态码,也不返回错误状态码,而是直接卡死或者是挂起了。这时候,作为发送方的你,不得不设置超时重试,不得不去猜测对面是不是挂了。这种没有反馈的消耗,比直接吵一架要累得多。因为它占用了你大量的系统资源去轮询和等待。
2.负载均衡失效
主动沟通、化解尴尬、推动进程。在技术上,这就是系统...