七大标准判别分布式系统的优劣(下)

七大标准判别分布式系统的优劣(下)

智能化的运维管理就像人体的免疫系统一样不可或缺,它可以围绕业务系统进行日常安全监测,掌握系统的各项指标,并根据指标作出“健康”与否的判断;对检测到的设备运行不正常状态或者设备故障发生预警,并及时通知运维管理人员进行维护。这种运维方式侧重于设备故障隐患和缺陷的早期发现和处理,提高了设备的稳定性和可靠性。

专业的运维管理解决方案涵盖如下要点:

1. 动态展示系统连接的拓扑图

与分布式相关的周边系统,尤其是网络系统,都与最终画面上屏的响应速度、图像质量、操作延迟、拼接同步性等效果息息相关。分布式节点通过交换机、路由器等网络设备连接,任何一个网络节点故障、掉线,都会使得某路画面黑屏,这时需要能够及时定位到故障点,才可以在最短时间内解决网络故障。

因此分布式系统的运维管理软件需要能提供一个动态变化的设备连接拓扑图,通过拓扑图直观地看到分布式设备及周边设备的在线状态与故障状态,不用实际到现场排查,就可以反馈给用户到底是哪个环节发生问题。

2. 图形化查看设备详细运行指标

除了设备的在线与否之外,为了更好的掌握系统运行状态与趋势,设备的详细运行指标也同样关键,如各个分布式节点的输入输出分辨率、帧率、视频传输速率等。与分布式设备连接的交换机,也需要实时了解其运行时间、温度、CPU占用率、内存占用率、某端口流量、抖动、丢包率等。

NEWS

新闻动态