云原生可观察性平台

产品简介

  云鹰平台是光大科技打造的面向云原生的全链路可观察性平台。支持数据中心可视化、拓扑动态发现、调用链路与物联网追踪、监控日志系统对接等功能;提供全链路可视化、指标分析、异常告警、全链路压测、轻量混沌工程、时光机等服务。平台旨在为开发运维人员全面掌握系统的工作原理、快速发现与分析业务应用的故障与性能瓶颈,提升开发效率和服务稳定性提供强大助力。

产品架构

产品特色

  • 关联多种监控数据并深度融合告警、指标、日志和追踪服务,基于可观察性理念,提供从告警到链路追踪层层深入的完整故障排查工作流,步步引导直达问题核心,全面提升监控体验与问题处理效率。

  • 基于代理与网络探针实现的链路追踪服务。可以为各个平台各种开发语言的应用与数据库、MQ、NoSQL等服务提供无侵入的链路追踪服务。提高分布式应用、微服务体系中问题定位和架构性能优化的效率。

  • 基于链路信息与指标数据动态发现并自动完成服务调用的可视化拓扑。以用户友好的方式精确及时地展示服务调用关系和关键请求数据。

  • 支持界面展示信息的高度可定制化。可以根据具体需求突出展示重点关注目标、或忽视一些不重要不关心的数据。不同的数据也可以通过方法的面板灵活选择不同的呈现形式。

  • 支持对接并聚合指标、日志、追踪等多种监控数据。主流数据系统均提供对接支持,最大化兼容现有监控架构。通过对多维度数据的聚合分析快速定位问题,进一步提升排查效率。

  • 开发者可以通过GraphQL、RESTAPI获取云鹰平台中链路数据,并将其集成在监控告警系统、大数据分析、弹性伸缩等场景中。

产品功能

  •   通过自定义追踪指标,可以对实例中的各类指标进行收集,如链路延迟、JVM堆大小、实例GC次数、数据库慢查询等;也可以为不同的指标设置不同的预处理方式,如收集一定时间内某参数的百分位数等。更好地帮助开发者定位问题所在。

  •   对于常见场景提供了相应的数据探针插件,同时提供基于各类语言开发的SDK工具,可以为各种场景开发定制合适的日志指标与追踪数据上报方式。

  •   平台支持多租户和RBAC等多种安全特性。在面板配置,数据源等多个维度提供高可定制化的数据隔离和访问控制策略,通过灵活的授权认证机制避免数据泄露,确保信息安全。

  •   以可视化方式为指标度量自由设置告警阈值,阈值被突破后将自动触发告警,告警可发送到诸如邮箱、企业微信、钉钉等多种内置通知器或者其他告警平台。

  •   支持对接丰富的外部系统,如物联网、数据中心CMDB、网络监测系统、CI/CD流水线、IaaS平台、PaaS平台、统一日志与监控系统等,持续收集各系统特定数据并进行实时追踪与展示,帮助开发和运维人员更加清晰直观地了解系统信息,全面掌控系统整体状态。

应用场景

  • ——— 全链路压测 ———

      云鹰平台提供了强大的数据采集能力与优秀的可视化界面。在进行全链路压测时可以通过云鹰平台轻松的观测整个系统中各个链路的响应时间,各个实例、端点、服务的压力变化。而云鹰平台本身带来的性能损耗非常的小,可以让开发者得到尽可能接近实际场景的测试结果,进而更加精确的进行容量评估。

  • ——— 混沌工程 ———

      通过时刻动态生成的网络拓扑,开发者可以观察到系统中各个应用之间依赖关系。而在进行混沌工程实践的情况下,开发者可以轻松的发现导致应用不可用的因素都包括哪些位置。从而能够针对性的修复并提高系统在故障环境下的稳定性。

  • ——— 微服务架构应用 ———

      通过云鹰平台,可以精准的发现微服务调用拓扑关闭和潜在架构的风险,为运维人员和架构师提供可靠的辅助信息,以便于快速修复问题和架构性能优化。结合日志可以做到业务关联的追踪可视化,帮助运营人员在特定场景下做到更明确的调整和优化。

  • ——— 云原生应用 ———

      通过云鹰平台,开发者可以追踪到一个应用从编译到上线的每一个过程。及时的确认问题所在环节,并快速的为其做出响应。对于开发语言多,机器多,实例多的云原生应用来说,云鹰平台提供了一个统一的、稳定的、快速的监控平台。为云应用提供全方面不间断的采集监控能力。