全站加速产品运维实践-阿里云(云淘科技)

随着全站加速(以下简称DCDN)产品的普及,越来越多的用户希望能结合阿里云丰富的产品线提供运维服务能力,用于业务健康监控、数据二次生产等。由于阿里云产品线较多,很多运维能力散落在不同的产品线,本文从用户视角出发,结合实际客户服务中反馈的运维痛点,整合了提炼了数据大屏、运营报表、业务监控和运维工具四个方面的实践,以期用户能通过本实践快速构建适合自身的运维能力。

业务场景

当客户业务接入全站加速(简称DCDN)产品后,希望能提供丰富的运维能力来帮助客户快速搭建自身的运维体系,常见的运维场景包括:

  • 数据大屏:将DCDN的访问数据转换为业务关心的数据展示出来,并形成整体的报表能力。
  • 运营报表:通过DCDN的数据分析,形成周期的定制报表供内部分析汇报使用。
  • 业务监控:针对业务有全方位的监控工具可以使用,并可以形成报警通知到客户业务方。
  • 运维工具:提供即时测试工具,可以自行拨测或提供给终端用户使用。

基于以上场景,围绕DCDN产品,将借助阿里云多产品能力来构建整体运维实践方案。

方案和使用方法

数据大屏

使用产品

全站加速(简称DCDN)、日志服务(简称SLS)

功能简介

DCDN提供了丰富的日志服务功能,其中一项功能为实时日志,在使用DCDN服务时,会产生大量的网络日志数据。通过实时日志功能,您可以实时采集节点产生的日志,并投递到日志服务(简称SLS)进行存储和消费,以便快速监控和定位业务问题。详见 什么是实时日志。

使用方法

  • 开通日志服务(简称SLS)产品。
  • 开通DCDN相关产品。
  • 开启实时日志,详见 开启实时日志投递。
  • 方案示例

    本案例为使用实时日志投递形成的分析报表,用户可根据业务需要使用内置的分析报表或自定义相关报表。详见:实时日志分析案例

    运营报表

    使用产品

    全站加速(简称DCDN)

    功能简介

    运营报表统计并展示了用户访问的PV/UV、地区和运营商、域名排行、热门referer、热门URL、回源热门URL和Top客户端IP七个报表内容,业务方可根据业务需求定制和订阅报表,订阅成功后系统会将报表发送到指定邮箱。使用运营报表功能前,您需要先定制运营报表才会进行数据生产统计。由于受日志完整性延迟的影响,数据生产时延较长,今天定制的报表通常次日生成。例如,2021年02月20日定制的报表,会在2021年02月21日生成。功能介绍:运营报表。

    使用方法

    • 定制运营报表配置方式:定制运营报表。
    • 订阅运营报表配置方式:订阅运营报表。

    方案示例

    订阅任务以及订阅后周期发送的邮件示例如下。

    业务监控报警

    使用产品

    云监控(CloudMonitor)、应用实时监控服务ARMS(Application Real-Time Monitoring Service)

    功能简介

    • 云监控

    阿里云监控自动获取您当前阿里云账号下云产品的资源。您可以查看各云产品的监控图表,了解资源的运行状况。您也可以通过设置报警规则,帮助您监控资源的运行状况。当符合报警规则时,云监控自动发送报警通知,便于您及时获悉资源的运行状况。

    • 应用实时监控服务ARMS

    云拨测利用遍布全球的监控网络,可以提供解析监控和业务性能监控等,并支持定时拨测和即时拨测,云拨测拥有地区、城市、运营商、时间序列等多个维度组合的数据分析模型,结合丰富的指标体系和直观的散点、趋势等在线图表,可以迅速定位目标应用性能问题的受影响范围及其根本原因,从而精准解决IT问题,提升服务质量。

    使用方法

    • 云监控
  • 登录云监控平台:云监控控制台。
  • 设置报警前,需要提前添加报警联系人:创建报警联系人或报警联系组。
  • 创建报警规则
  • 添加报警联系人后,选择 云产品监控 > 全站加速关联资源:资源范围可以选择Domain。设置报警规则:相关监控支持指标详见 可监控指标列表。通知方式:支持短信、邮件、钉钉。

    • 应用实时监控服务ARMS

    功能包括定时拨测和即时拨测。定时拨测可以配置测试的时间周期、测试频率等,从而可以进行周期或者长期的监测任务;即时拨测为单次即时测试,能够无侵入的快速进行单次拨测,并将结果数据实时回传,方便对于已发现的问题进行迅速验证。相关配置方法如下:

    • 定时拨测:定时拨测配置方式
    • 即时拨测:即时拨测配置方式

    方案示例

    云监控钉钉报警示例如下:​应用实时监控服务ARMS监测结果相关页面展示如下:ARMS图片

    运维工具

    使用产品

    无需开通其他产品

    功能简介

    阿里云运维网站检测平台:提供了常见运维工具供业务侧使用,包括网站诊断分析、网络拨测工具(HTTP检测、Ping检测、DNS检测、路由追踪检测)等,同时提供了丰富的API可以供调用。工具地址:阿里云运维网站检测平台。

    使用方法

    网站诊断分析:直接输入域名即可。网络拨测工具(HTTP检测、Ping检测、DNS检测、路由追踪检测):按提示输入域名/ip即可。

    方案示例

    • 网站诊断分析

    • HTTP检测

    • Ping检测

    • DNS检测

    • 路由追踪检测

    发表评论