dreampet请教小规模服务器群的自动化监控、维护方案 中发帖

公司现在不到10台服务器,都是我在这10来年陆续搭建起来的,目前的情况如下: 
5台物理服务器的PVE集群,如下图, 目前跑了13个虚拟机(Ubuntu + Windows Server)
[image]
1台物理服务器单独跑PVE,运行两个虚拟机,用于公司云盘还有前面PVE集群的热备份
[image]
其中部分虚拟机还部署了Docker, 跑一些小服务,比如AI代理、VPN服务器等
此外,还有2台独立的物理服务器,用于每周末定时冷备份。
现在的困扰就是,无法便捷的查看所有物理服务器、虚拟机的运行状态,每次都要:

登录各个物理服务器的iDRAC、KVM,查看各个物理硬盘、RAID的运行情况
登录PVE集群,查看各个虚拟机的情况
进入个别虚拟机,查看 Docker 的运行情况
登录个别物理服务器的SSH,查看硬盘、系统运行情况

以上, 请教各位大佬, 有没有什么开源方案...