业务挑战
海量日志数据散落在系统各处,难以做到日志的统一采集与集中管理
无法在不干扰业务系统的情况下保证监控的实时性
成员行熔断信息滞后且仅可手动通知,无法保证及时性
为什么用日志易
日志易智能日志中心平台具备高性能、分布式、可扩展的日志处理架构,每秒钟可分析数百万条日志,每天处理上百 TB 级的日志量,同时平台预置了数百种日志分析模型,能够自动解析并处理常见的基础架构类系统日志。为应对双十一的流量高峰,农信银依托日志易建设了日志数据实时分析平台,根据日志易现有的完整日志管理规范,对相关的日志数据进行接入、解析,自定义统计分析规则及可视化展示,自定义关键指标监控及告警规则,以实现对系统状态的全面掌控,保证用户体验。
产品功能亮点
实现价值
交易耗时分析: 用时减少了97%
"database": { "client": "mysql", "connection": { "host": "localhost", "user": "root", "password": "1qaz@WSX", "database": "ghost_prod" } },
在建设日志分析平台前,农信银每次需要花费 5 分钟左右的时间去查询所有机器,并手动计算交易耗时。部署日志易之后,查询某一笔交易耗时仅需 10 秒钟,同时能够一次性查询出相同Msqld的报文,并对相关交易耗时进行排名和差异化体现,方便识别交易耗时较长的环节,及时实位问题。
业务监控大屏展示: 延迟缩短了98%
"database": { "client": "mysql", "connection": { "host": "localhost", "user": "root", "password": "1qaz@WSX", "database": "ghost_prod" } },
使用日志易之前,监控大屏需从数据库中提取数据,展示延迟可达1分钟之久;接入日志易后,仅需1秒钟即可完成数据展现。
异常感知及定位: 耗时减少了90%
"database": { "client": "mysql", "connection": { "host": "localhost", "user": "root", "password": "1qaz@WSX", "database": "ghost_prod" } },
异常发现的耗时从以往的 5 分钟左右缩短至 30秒,即平台可在 30秒内完成日志获取、发送、结构化分析、存储、检索、告警、可视化等自动操作。
熔断信息查询定位: 用时缩短了90%
"database": { "client": "mysql", "connection": { "host": "localhost", "user": "root", "password": "1qaz@WSX", "database": "ghost_prod" } },
熔断信息查询定位方式由以往的人工确认转换为机器自动感知,所需时间也由原来的10分钟左右缩短至60秒,即平台能在 60s 内精准定位成员行是否被熔断、熔断时间、熔断时长及熔断恢复时间等信息。
最新交易的异常查询时间由原来的10分钟以上缩短至1分钟以内。
客户评价
部署日志易后,日志数据被标准化了,使用门槛也降低了很多,日志同步速度得到了提升。以前我们只能做到搜索日志和告警,现在还可以对数据进行统计分析,整个团队的运维效率有所提升。把日常基础的监控分析交给日志易平台后,运维人员就可以把更多的精力放在更复杂、更高级的运维工作上。
业务挑战
海量日志数据散落在系统各处,难以做到日志的统一采集与集中管理
无法在不干扰业务系统的情况下保证监控的实时性
成员行熔断信息滞后且仅可手动通知,无法保证及时性
为什么用日志易
日志易智能日志中心平台具备高性能、分布式、可扩展的日志处理架构,每秒钟可分析数百万条日志,每天处理上百 TB 级的日志量,同时平台预置了数百种日志分析模型,能够自动解析并处理常见的基础架构类系统日志。为应对双十一的流量高峰,农信银依托日志易建设了日志数据实时分析平台,根据日志易现有的完整日志管理规范,对相关的日志数据进行接入、解析,自定义统计分析规则及可视化展示,自定义关键指标监控及告警规则,以实现对系统状态的全面掌控,保证用户体验。
产品功能亮点
实现价值
交易耗时分析: 用时减少了97%
"database": { "client": "mysql", "connection": { "host": "localhost", "user": "root", "password": "1qaz@WSX", "database": "ghost_prod" } },
在建设日志分析平台前,农信银每次需要花费 5 分钟左右的时间去查询所有机器,并手动计算交易耗时。部署日志易之后,查询某一笔交易耗时仅需 10 秒钟,同时能够一次性查询出相同Msqld的报文,并对相关交易耗时进行排名和差异化体现,方便识别交易耗时较长的环节,及时实位问题。
业务监控大屏展示: 延迟缩短了98%
"database": { "client": "mysql", "connection": { "host": "localhost", "user": "root", "password": "1qaz@WSX", "database": "ghost_prod" } },
使用日志易之前,监控大屏需从数据库中提取数据,展示延迟可达1分钟之久;接入日志易后,仅需1秒钟即可完成数据展现。
异常感知及定位: 耗时减少了90%
"database": { "client": "mysql", "connection": { "host": "localhost", "user": "root", "password": "1qaz@WSX", "database": "ghost_prod" } },
异常发现的耗时从以往的 5 分钟左右缩短至 30秒,即平台可在 30秒内完成日志获取、发送、结构化分析、存储、检索、告警、可视化等自动操作。
熔断信息查询定位: 用时缩短了90%
"database": { "client": "mysql", "connection": { "host": "localhost", "user": "root", "password": "1qaz@WSX", "database": "ghost_prod" } },
熔断信息查询定位方式由以往的人工确认转换为机器自动感知,所需时间也由原来的10分钟左右缩短至60秒,即平台能在 60s 内精准定位成员行是否被熔断、熔断时间、熔断时长及熔断恢复时间等信息。
最新交易的异常查询时间由原来的10分钟以上缩短至1分钟以内。
客户评价
部署日志易后,日志数据被标准化了,使用门槛也降低了很多,日志同步速度得到了提升。以前我们只能做到搜索日志和告警,现在还可以对数据进行统计分析,整个团队的运维效率有所提升。把日常基础的监控分析交给日志易平台后,运维人员就可以把更多的精力放在更复杂、更高级的运维工作上。