@heidi线上发现一个非常离谱的问题,麻烦大家提供一点排查思路 中发帖

背景:spring gateway网关(webflux容器 4.1.5版本)转发ws请求到一个tts服务(servlet容器 3.3.13版本),tts服务使用grpc调用其他模型提供商的tts引擎(提供商有火山、腾讯、科大讯飞等等)。服务使用k8s集群部署,两个组件运行在同一个容器中 
问题:使用grafana alloy组件抓取指标信息,只要就并发流量tts服务就会导致alloy组件抓取指标逐步升高(scrape_duration_seconds指标逐步升高,然后超过10s就超时,然后网管就没有监控指标了)。
gc,资源等问题都排查过了,并没有发现什么问题。现在就很迷茫,各位有什么推荐的排查方案么?
[img_v3_02ud_c799eb3b-bcd8-479a-ad65-44446825347g]
[img_v3_02ud_b5bb3736-204a-4bd9-bff3-ce...