优维产品最佳实践第9期:主机合规性检查

我们常常会感到这样的困惑,为什么这么多的无效主机记录,为什么这些主机很多信息空白,当许多人一起维护主机信息时,常常会出现信息错漏的情况。主机是运维最重要最基本的CMDB信息,而「合规性检查」为我们提供了更高效便捷的管理主机实例信息的方式。 本期EasyOps产品使用最佳实践,我们将为您揭晓: 如何对主机设置规格配置条件 优化通知格式的方式
「主 机 违 规 配 置」
以实际配置为例。由于数据违规规则是”且“条件,需同时满足才会触发违规,因此一般一条违规规则只配置一个违规条件。
1.运营信息 同一类对象的同一类信息的检查可以放一起。例如下面几个都是运营信息,作为识别主机的使用情况,不用再查找主机时发现很多信息空白,对于统计团队的主机使用情况、运营统计分析,监控告警、主机回收通知运维负责人,到期及时主机回收等都非常方便。 2.宿主机信息 这里只针对宿主机,因此和运营信息共用同一条规则,而是需要单独创建规则。 配置主机和机柜的关联关系,维护机房的拓扑架构。 3.虚拟机信息 虽然执行实例都一样,但是这3种违规都是针对不同情况下可能出现的违规,因此需要分开配置。 虚拟机我们需要维护和宿主机的关系,之前在HOST记录了虚拟机的信息,但是由于没有维护关联的宿主机,导致需要重启虚拟机时,无法立刻找到是在哪台宿主机上,因此该关系的检查也是必不可少。 注意:这里命名规则由于我们通常使用dev-host-0-2-test、ops-host-100-3-training作为主机名,因此可以如上图配置违规条件。 4.逾期检查 例如当某条主机的有效日期是昨天,那么今日大于昨天1,符合在9999天内的条件,则触发违规。通知管理员及时回收主机,避免主机的浪费,提高资源的回收率和可用性。 5.临期检查 例如当某条主机的有效日期是明天,那么今日小于明天1天,符合在7天内的条件,则触发违规。 6.主机Agent状态 对于主机Agent状态异常的主机,及时提醒通知。避免Agent状态异常导致工具、监控数据等异常。 执行周期在同一时间,将会把多条违规的规则合并成一条信息通知。 钉钉机器人通知效果 邮件通知效果 点击蓝色超链接即可打开规则详情页面,点击最新执行详情,可以查看具体的违规实例。 钉钉通知配置文件:/usr/local/easyops/resource_manage/static/template/datafilter/default/dingding_robot.content.template 邮件通知配置文件:/usr/local/easyops/resource_manage/static/template/datafilter/default/email.content.template 修改后重启resource_manage即可生效。违 规 通 知