监控 DNS 解析成功率并设置告警阈值通常需要通过云监控服务或专门的 DNS 监控工具实现。首先需开通网络分析与监控服务,创建 DNS 监控任务,指定目标域名及探测点。其次,在告警配置中设置关键指标阈值,如解析延迟或失败率,当指标超过阈值时触发告警。最后,配置通知方式,包括邮件、短信或 Webhook,确保运维人员能及时接收异常通知并处理,从而保障业务连续性。不同云平台提供自定义报警配置与继承全局报警配置两种方式,支持设置重复告警间隔及多级告警级别。
监控 dns 怎么设置
监控 DNS 地址设置通常涉及监控设备网络配置或 DNS 服务监控配置两种场景,需根据实际需求选择对应方法。登录管理界面:在浏览器输入设备 IP 地址 (默认如 192.168.1.10),使用管理员账号登录 WEB 页面。查找网络选项:进入“设定”或“控制面板”,选择“基本设定”下的“网络设定”菜单。手动指定 DNS:将 DNS 获取方式改为“使用下列 DNS 服务器地址”,输入首选及备用 DNS IP。保存并重启:确认配置后保存,部分设备需重启以使新 DNS 生效。若设备支持 DHCP,也可选择“自动取得 DNS 服务器地址”。2 DNS 服务监控配置 开通监控模块:登录云解析控制台,在权威域名解析页面点击 DNS 监控模块并开通服务。添加监控任务:单击“添加监控域名”,在弹框中选择需监控的目标域名和主机记录。配置告警策略:设置监控指标及通知方式,当 DNS 解析异常时系统会自动发送告警消息。常用公共 DNS 包括 114.114.114.114、8.8.8.8 等,建议根据网络运营商选择最佳地址。
告警设置
云解析 DNS 会从系统负载、解析响应、网络连通等维度监控自建 DNS 集群的健康状况,您可根据业务需要配置告警,及时感知异常告警。重要 为防止因本地与云控制台之间的网络中断而导致告警通知失败,设置告警后,将由自建 DNS 软件的本地管控代理服务负责发送告警通知。访问告警设置 - 自建 DNS。填写表单,提交配置。表单项 说明 告警通知设置 告警级别 设置需要发送通知的告警级别。可选值包括:严重级别:对应告警事件里的严重。高级及以上级别:包括告警事件里的严重、高。中级及以上级别:包括告警事件里的严重、高、中。所有级别:包括告警事件里的严重、高、中、低。重复告警通知间隔 设置重复告警的通知发送间隔。例如,选择间隔 30 秒通知,如果同一告警在距离上一次通知 30 秒内再次触发,则系统会等待间隔满 30 秒后再发送通知。可选值包括:间隔 30 秒通知、间隔 1 分钟通知、间隔 3 分钟通知、间隔 5 分钟通知、间隔 10 分钟通知、间隔 30 分钟通知、间隔 60 分钟通知、间隔 12 小时通知、间隔 24 小时通知、不通知。告警通知方式 邮件通知 启用后,当指定级别的告警触发通知时,系统将通过配置的 SMTP 服务器向联系人发送邮件。页签切换到邮件通知 (默认)。点击切换开关,启用邮件通知。点击邮件网关设置,配置发件邮箱的相关信息。填入需要接收事件通知的联系人。可填写多个邮件地址,每行一个。启用后,当指定级别的告警触发通知时,系统将通过 HTTP/HTTPS 协议向指定的 Webhook 地址 (例如钉钉、企业微信、飞书) 发送告警信息。页签切换到启用 Webhook 通知。点击切换开关,启用 Webhook 通知。填入钉钉、企业微信、飞书或自定义 Webhooks 地址。Syslog 通知 启用后,当指定级别的告警触发通知时,系统会将事件日志通过 Syslog 协议发送到远端的日志服务器。页签切换到 Syslog 通知。点击切换开关,启用 Syslog 通知。点击 Syslog 网关设置,选择 Syslog 推送协议 tcp/udp,填写 syslog 服务器地址。
配置重点域名监控的 DNS 解析异常告警通知 - 云解析 DNS-阿里云
当关键业务域名发生 DNS 解析异常,若未能及时发现,可能导致服务中断和业务损失。重点域名监控的告警功能对域名解析状态进行持续检测。当发现异常或恢复正常时,系统通过邮件、短信、机器人等多种方式发送实时通知,以帮助用户感知风险并快速响应。DNS 拨测:拨测节点持续对目标域名发起各项监控任务的拨测请求。状态判断:当监控项拨测结果不符合预期,域名监控会将监控项标记为 监控异常。触发报警:监控项状态变为 监控异常 或从监控异常 恢复为 监控正常 时,会产生一个报警事件。发送通知:重点域名监控根据配置的报警规则,将此事件通过指定的通知方式 (邮件、短信) 发送给相应的报警联系人。操作步骤 一、设置报警通知组 报警通知组 读取阿里云的云监控产品中设置的报警通知组,请务必至少创建一个报警组,详见创建报警联系人或报警联系人组。二、报警配置 为了同时兼顾配置的便捷和灵活性,系统支持 自定义报警配置 与继承全局报警配置。方式一:自定义报警配置 方式二:继承全局报警配置 接入域名有独立的报警需求时,可自定义报警配置。访问云解析 DNS-重点域名监控,找到目标监控任务,点击操作栏的 报警 按钮。弹出报警设置界面,完成表单配置。配置方式:选择 自定义报警配置,此时报警通知组、报警通知方式都可自定义设置。相同告警重复次数:连续异常超过指定次数则停止告警,直到恢复再发出异常恢复告警。报警通知组:选择一、设置报警通知组在云监控配置的报警通知组,可多选,最多支持 5 个。报警通知方式:指触发报警的事件类型和报警通知方式。报警事件类型 包括域名解析监控异常、域名解析监控异常恢复。报警方式包括 邮件通知、机器人通知、短信通知。其中机器人通知支持钉钉、企业微信、飞书。
通过站点监控功能监控 DNS 解析异常
当域名解析异常时,您可以通过报警信息分析异常原因,还可以根据探测结果排查问题。本文以中国境内各省份的三大运营商 (中国移动、中国电信、中国联通) 探测某个域名为例,为您介绍如何通过站点监控功能监控 DNS 解析异常。域名解析 (DNS) 就是将域名转换为网络 IP 地址的服务。域名通常容易记忆且带品牌标识,因此常作为对外提供服务的网络地址。用户访问域名的过程实际是通过 DNS 解析获得服务的真实网络 IP 地址,最终访问对应的 IP 地址。DNS 解析过程如下图所示。域名解析是通过运营商递归 DNS 来完成的,运营商递归 DNS 会从根服务器递归查询到权威 DNS 服务器,最终找到域名解析指向的 IP 地址 (对应图中步骤 2、3、4)。PC 设备上网默认获取的 DNS 服务 IP 地址就是运营商递归 DNS 服务器 IP 地址 (递归 DNS 也常叫公共 DNS),由于运营商通常以省为单位建设递归 DNS 服务,所以如果递归 DNS 服务发生解析异常,会影响对应省份运营商网络的所有用户。用户访问域名后会从运营商递归 DNS 获取到域名解析结果 IP 地址,但少数情况下从运营商递归 DNS 获取的域名解析结果不一定正确 (即与域名持有人在权威域名解析服务器设置的域名解析指向地址不相同,例如:域名解析污染、域名解析劫持、权威 DNS 服务故障等情况),此时会导致用户无法正常访问服务。因此互联网上重要服务的域名持有者,希望能监控用户从全国各个省份运营商的递归 DNS 服务器拿到正确的解析结果,以便确定全国用户能否正常访问自己的服务。前提条件 请确保您已开通网络分析与监控。具体操作,请参见开通网络分析与监控。通过站点监控功能创建 DNS 监控任务,监控中国境内三大运营商 (中国移动、中国电信、中国联通) 各省份用户访问监控目标域名时的解析是否正常。登录云监控控制台。在左侧导航栏,选择网络分析与监控 > 站点监控。在监控任务页签,单击创建任务。在创建任务页面,设置 DNS 解析监控任务的相关信息。基本信息:任务类型选择 DNS,任务名称输入 dns_task,监控地址输入 aliyun.com,DNS 服务器选择探测点对应的运营商 DNS,期望解析结果 (即域名解析目标地址) 输入 192.168.XX.XX,其他参数均使用默认值。选择探测点:选择中国移动、中国电信和中国联通的所有探测点,其他参数均使用默认值。设置告警:使用默认报警规则。配置报警联系组:选择任意一个报警联系组。单击创建。步骤二:查看站点监控结果
监控与报警
创建阈值报警规则 您可以在云监控控制台创建告警规则对指标进行监控。当资源的监控指标达到告警条件,云监控将向您发送告警消息,报告异常监控数据,帮助您及时掌握异常状态并处理,保证业务顺畅进行。云监控提供了自定义创建告警模板的功能,您可以选择在默认模板推荐的监控指标上进行修改,或自定义添加告警指标完成自定义告警模板的添加。操作步骤 在云监控控制台左侧导航栏,点击“告警规则”,再点击右上角“创建告警规则”。选择监控对象和监控指标,填写规则信息,点击“确定”即可创建告警规则。配置参数如下:
| 步骤类别 | 参数 | 参数说明 |
|---|---|---|
| 选择监控对象 | 规则类型 | 选择指标监控:对数据指标进行监控。 |
| 云服务 | 选择内网 DNS 监控。 | |
| 维度 | 选择权威域名。 | |
| 监控对象类型 | 选择具体实例或资源分组。 | |
| 选择监控指标 | 选择类型 | 可以选择从模板导入或自定义创建。 |
| 模板 | 选择需要导入的模板。 | |
| 监控指标 | 选择需要监控的数据指标。 | |
| 策略 | 可以选择原始值、平均值、最大值、最小值。 | |
| 聚合周期 | 选择数据聚合的周期。 | |
| 出现次数 | 选择出现多少次触发通知。 | |
| 发送通知 | 配置是否发送邮件通知用户,可以选择“是”或者“否”,推荐选择“是”。 | |
| 选择告警联系组 | 配置发生告警通知的用户组。 | |
| 重复告警 | 告警发生后,如果监控项未恢复正常,之后间隔多久再次发送告警。 | |
| 触发场景 | 触发告警邮件的场景,可在告警及恢复时发送提醒信息。 | |
| 通知周期 | 配置告警通知的周期时间。 | |
| 通知时段 | 配置告警通知的时间段。 | |
| 通知方式 | 配置告警通知的通知方式,支持邮箱及短信。 | |
| 告警回调 | 填写接口 URL,例如 https://example.com:8080/callback。 | |
| 规则信息 | 名称 | 填写该告警规则的名称。 |
FAQ
问:设置告警阈值时应该选择哪些关键指标?
答:关键指标通常包括解析响应时间、解析成功率、网络连通性等,当这些指标超过设定的阈值时应及时发送告警通知。
问:告警通知支持哪些渠道?
答:告警通知方式支持邮件、短信、机器人通知(如钉钉、企业微信、飞书)以及 Syslog 日志推送等多种通讯工具。
问:如何避免告警通知过于频繁?
答:可以通过设置重复告警通知间隔来解决,例如选择间隔 30 分钟通知,如果同一告警在距离上一次通知 30 分钟内再次触发,系统会等待间隔满后再发送。
问:监控节点覆盖范围如何?
答:全球部署 200+ 监控节点,支持中国主流运营商、省份和地域,可监控中国境内三大运营商各省份用户访问监控目标域名时的解析是否正常。