APM 和 ITOA - 理清混乱
来源:http://www.apmdigest.com | 作者:Alice | 发布时间: 2016-04-25 | 7221 次浏览 | 分享到:

我在社交媒体上看到一则有关应用性能管理的讨论,意识到在关于应用性能管理是什么上存在很多混乱。

仅是从字面使用上看,你会认为应用性能管理Application Performance Management (APM) 是聚焦在查看和监控特定条件和状态下的数据。应用性能管理会让你认为这是一个宽泛的领域,包括了一系列技术以确切地监控应用,但同时也管理IT资产的其它方面。 使用复杂性分析的程度尚不清晰,但潜在的 IT Operational Analytics (ITOA) 可以被看做是应用性能管理的一个子项,虽然把重点放在应用上会使它相对于 ITOA 在范围上更受限制。

为了帮助澄清这些术语,我们使用了两种更清晰和具有逻辑性且相比 APM ITOA 定义歧义更少的模型。

监控成熟度模型

第一个模型我们称之为监控成熟度模型,因为它是一个分层的模型,一般更高层级是基于从更低层级收集而来的数据之上,包括:

1. 基础架构监控:数据收集,来自于服务器、操作系统、网络和存储设备,并设置基于告警的规则以捕获潜在问题。

2. 基本应用监控:通过查询操作系统,捕获和告警有关进程在服务器上运行的数据,这会包括 CPU 和内存使用率,磁盘 I/O,网络 I/O 等。

3. 高级应用监控:在服务器上安装一个定做的代理,捕获正在监测的特定应用的数据。这可以是应用内数据或者是应用外 这对于现成的软件和中间件是很有效的。

4. 数据流监控:捕获应用程序之间的数据信息传递以及数据流监测报告,这会包括每秒成交量、每个交易方的成交量、延时等。

5. 业务和 IT 分析: 来自层级1和层级2的业务数据和机器数据分析,以了解业务活跃度和 IT 资产的行为。

监控 vs 分析

第二个模型是分离监控和分析,这没有固定的定义来分离它们,因此我们把分析类型分成三类:

1. 探测:这是一个基于告警条件探测的规则,这是大家通常在谈论监控时所想到的。

2. 分析: 这是一个大量数据的集合,甚至这些数据并没有触发某个探测规则,分析这些数据会发现更多可洞察的内容,这可能是简单的趋势,或复杂的机器学习和基于时间序列模式的异常检测,这也包括像贝叶斯网络的因果分析的技术。

3. 预测: 使用当前和历史数据来试着预测未来或 “what if” 场景,再则,这可以简单地推测,或推测复杂的当前状态的比较实证推导行为数据,诸如此类的数据可能你已经在性能实验室中压力测试某个应用程序时已经收集到。

无论你的 IT 资产和应用程序行为是哪种模型,它都需要有一个清晰的说明,以便大家可以交流同样的事情。

DYNAMIC NEWS

新闻动态