变色龙 (@bianselong)Cloudflare承认11月14日的软件更新导致55%的客户日志永久性丢失 中发帖

2024 年 11 月 14 日 Cloudflare 日志服务出现故障导致无法输出日志,尽管 Cloudflare 工程师已经尽力修复,但日志服务依然中断 3.5 小时并且丢失大约 55% 的日志,这些日志因为是永久性丢失因此无法恢复。 
日志服务通常对网络服务来说至关重要,因为可以通过日志分析访问数据、排查故障和找到潜在的恶意攻击等情况,因此日志服务故障也属于严重问题。在最新发布的事故调查报告中 Cloudflare 承认此次故障的主要原因是部署的软件更新存在错误,这导致 Cloudflare Logs 没有正确向客户发送日志信息。
由于日志通常都是极多的数据所以 Cloudflare 使用名为 Logpush 的工具将日志分割成可预测大小的包,这些包再通过合理的节奏推送给客户用于分析。
11 月 14 日 Cloudflare 工程师对 Logpush 进行更改支持更多额外的数据...