监控平台解密:IT系统风险感知和洞察
全新正版未拆封
¥
30.76
3.0折
¥
102
全新
仅1件
作者姜才康
出版社电子工业出版社
出版时间2022-05
版次1
装帧其他
上书时间2024-04-25
商品详情
- 品相描述:全新
图书标准信息
-
作者
姜才康
-
出版社
电子工业出版社
-
出版时间
2022-05
-
版次
1
-
ISBN
9787121433771
-
定价
102.00元
-
装帧
其他
-
开本
16开
-
页数
308页
-
字数
388千字
- 【内容简介】
-
本书采用循序渐进的讲解方式,介绍了如何从零开始构建一个企业级监控平台的相关理论技术和实践方法。首先从监控系统总体设计原理出发,逐步介绍企业级监控系统的常用架构、各个组件模块作用、运行模式、监控体系的建设路线、监控信息的合并算法、监控颗粒度设置经验以及如何保障监控系统自身可靠性等内容;随后自底向上依次对硬件设备、操作系统、虚拟机、常用数据库和中间件、容器和容器编排、系统和应用日志以及应用链路等常见监控领域实施监控的技术原理、常用监控指标以及实现方式等内容作了介绍;后对监控系统下阶段发展趋势也即智能监控作涉及相关技术原理及常用智能监控功能作了展望及介绍。通过对本书的系统学习,可以对计算机监控系统的基本原理、设计思想、实现方式等方面有全面而深入的了解。
- 【作者简介】
-
姜才康,现任中汇信息技术(上海)有限公司总经理,中国计算机用户协会金融信息分会理事,上海计算机学会理事,上海信息化理事。在金融信息化建设方面贡献突出,长期从事金融行业应用软件设计开发、技术标准制定和技术管理工作,不断夯实金融基础设施,构建全方位的银行间市场风险治理和安全运维体系,先后获得数十项银行发展科技奖。主持开发了完成新一代外汇交易系统、新一代本币交易系统、汇率中间价系统、上海同业拆放利率(Shibor)、基于双边授信撮合系统、报价引擎、数据发布、交易后系统、增值服务系统、汇率指数、定盘收益率曲线等数十个金融系统的开发建设任务。主要著作有《大数据系统运维》(2018),《数据挖掘基础》(2018),另有《外汇交易中心集中统一监控平台建设实践》、《银行间市场金融标准化建设的实践之道》、《中国货币网的建设及发展》等多篇论文发表。
- 【目录】
-
第1章 监控系统规划及原理1
1.1 IT监控运维管理的发展历程1
1.1.1 新兴的中国市场(1985—1994年)2
1.1.2 运营商大建设期(1995—2000年)2
1.1.3 多元化的监控运维系统(2001—2010年)4
1.1.4 面向云和应用(2010年至今)5
1.2 监控体系总体规划5
1.2.1 IT运营体系的阶段性5
1.2.2 监控体系建设的阶段性7
1.3 监控系统的分类12
1.4 监控系统工作原理13
1.5 监控系统运行模式分类16
1.5.1 主动/被动监控16
1.5.2 有代理/无代理18
1.6 监控事件总线19
1.6.1 什么是集中监控事件总线19
1.6.2 事件总线的市场格局20
1.6.3 监控事件总线的功能设计22
本章小结25
第2章 计算机硬件设备监控26
2.1 计算机的分类26
2.2 数据中心常见的计算机种类27
2.2.1 大型机27
2.2.2 小型机、PC服务器28
2.2.3 RISC、CISC30
2.2.4 刀片机31
2.3 计算机硬件设备监控31
2.3.1 大型机设备监控32
2.3.2 小型机设备监控33
2.3.3 PC Server设备监控41
2.3.4 刀片机设备监控46
本章小结47
第3章 虚拟机监控48
3.1 虚拟化分类48
3.1.1 硬件虚拟化49
3.1.2 桌面虚拟化49
3.1.3 应用程序虚拟化49
3.1.4 网络虚拟化49
3.2 ESXi虚拟化监控50
3.2.1 ESXi虚拟化概述50
3.2.2 ESXi架构图及监控入口53
3.2.3 使用Zabbix监控ESXi53
3.3 KVM虚拟化监控60
3.3.1 KVM虚拟化概述60
3.3.2 使用Zabbix监控KVM61
本章小结63
第4章 操作系统监控64
4.1 操作系统的种类64
4.1.1 类UNIX系统64
4.1.2 Windows系统65
4.2 操作系统功能模块66
4.3 CPU监控69
4.3.1 CPU相关概念69
4.3.2 CPU状态70
4.4 内存监控72
4.4.1 内存相关概念72
4.4.2 内存状态74
4.5 进程监控74
4.5.1 进程相关概念74
4.5.2 进程状态监控76
4.6 文件属性监控78
4.6.1 Windows中的文件属性78
4.6.2 类UNIX中的文件属性78
4.7 文件系统监控83
4.7.1 文件系统概念83
4.7.2 文件系统状态84
4.8 网络模块监控85
4.8.1 网络流量监控85
4.9 监控系统如何监控操作系统87
4.9.1 Windows87
4.9.2 Linux90
本章小结92
第5章 数据库监控93
5.1 数据库分类93
5.1.1 关系型数据库94
5.1.2 非关系型数据库94
5.2 数据库状态指标分类94
5.3 当前连接数与允许连接数95
5.3.1 连接数的相关概念95
5.3.2 连接数指标实例95
5.4 QPS/TPS99
5.4.1 QPS/TPS的相关概念99
5.4.2 QPS/TPS指标实例99
5.5 慢查询102
5.5.1 慢查询的相关概念102
5.5.2 慢查询指标实例102
5.6 磁盘I/O监控108
5.6.1 磁盘I/O相关概念108
5.6.2 磁盘I/O的获取108
5.7 其他针对性指标110
5.7.1 Mysql Binlog cache的相关概念110
5.7.2 Mysql Binlog cache指标实例111
5.7.3 Oracle表空间的概念112
5.7.4 Oracle表空间指标实例112
5.7.5 Mysql MHA高可用集群的概念113
5.7.6 Mysql MHA高可用集群指标115
5.7.7 Oracle集群的概念117
5.7.8 Oracle集群指标实例118
本章小结126
第6章 中间件监控127
6.1 Nginx监控128
6.1.1 Nginx概述128
6.1.2 Nginx服务的进程及端口128
6.1.3 服务可用性监控130
6.1.4 Nginx日志监控131
6.1.5 Nginx状态页监控134
6.2 Tomcat监控136
6.2.1 Tomcat概述136
6.2.2 请求吞吐量指标和延迟指标137
6.2.3 线程池指标140
6.2.4 Errors错误率指标144
6.2.5 JVM内存使用情况指标146
6.2.6 JVM监控工具149
6.3 ActiveMQ监控152
6.3.1 ActiveMQ概述152
6.3.2 生产者数量监控152
6.3.3 消费者数量监控153
6.3.4 队列深度监控154
6.3.5 ActiveMQ监控实践155
本章小结157
第7章 Docker容器监控159
7.1 Docker容器运行状态159
7.2 Docker容器性能指标161
7.3 cAdvisor对容器监控162
7.3.1 CPU的监控164
7.3.2 内存的监控165
7.3.3 磁盘的监控165
7.3.4 网络的监控165
7.4 Docker容器内的应用日志监控166
本章小结170
第8章 Kubernetes监控171
8.1 Kubernetes简介171
8.2 Prometheus简介174
8.3 Prometheus部署176
8.4 Kubernetes集群监控186
8.4.1 宿主机监控187
8.4.2 容器监控196
8.4.3 集群资源监控199
8.4.4 API Server监控207
8.4.5 应用系统监控209
本章小结214
第9章 应用监控215
9.1 应用性能管理概述215
9.2 调用链路跟踪217
9.2.1 Span的概念218
9.2.2 Trace的概念220
9.3 APM系统的设计与实现222
9.3.1 APM系统通用架构222
9.3.2 Span的创建及SpanContext的传递逻辑223
9.3.3 TraceID和SpanID的生成方法225
9.3.4 代码注入方法227
9.3.5 APM系统性能优化228
本章小结231
第10章 日志监控232
10.1 日志的基本概念232
10.2 日志的作用233
10.2.1 运维监控233
10.2.2 资源管理233
10.2.3 入侵检测234
10.2.4 取证和审计234
10.2.5 挖掘分析235
10.3 常见日志类型及格式235
10.3.1 W3C Extended Log File格式236
10.3.2 Apache access log237
10.3.3 Syslog237
10.4 日志规范239
10.4.1 应用日志打印规范240
10.4.2 日志的轮转归档241
10.4.3 日志的爆发抑制242
10.5 日志监控基本原理243
10.5.1 前置式日志监控243
10.5.2 集中式日志监控244
10.5.3 日志监控的基本过程245
10.6 日志监控的常见场景246
10.6.1 关键字监控246
10.6.2 多节点日志监控247
10.6.3 应用系统性能监控248
10.6.4 应用系统业务量异常监控250
10.6.5 安全监控与异常IP自动封禁250
10.7 日志采集与传输251
10.7.1 拉式采集(PULL)252
10.7.2 推式采集(PUSH)252
10.7.3 日志过滤253
10.8 日志解析与日志监控策略254
10.8.1 日志解析工具254
10.8.2 正则表达式258
10.8.3 日志监控策略261
10.9 常见日志监控系统262
10.9.1 基于ELK的日志监控262
10.9.2 基于Splunk的日志监控263
本章小结265
第11章 智能监控266
11.1 智能监控概述267
11.1.1 Gartner AIOps267
11.1.2 NoOps267
11.1.3 智能监控实施路径268
11.2 监控数据治理269
11.2.1 大数据平台选型269
11.2.2 大数据平台设计270
11.2.3 监控运维数据治理271
11.3 监控动态基线273
11.3.1 动态阈值设计与计算274
11.3.2 基于动态阈值异常检测276
11.3.3 监控动态阈值案例276
11.4 监控自愈278
11.4.1 什么是自愈278
11.4.2 自愈的优势283
11.4.3 监控自愈模块设计284
11.4.4 监控自愈案例分享285
本章小结286
参考文献287
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价