当前位置:云计算企业动态 → 正文

为什么CloudWatch控制室是空的?

责任编辑:editor005 作者:Harris编译 |来源:企业网D1Net  2017-07-25 14:47:49 本文摘自:机房360

CloudWatch可能是AWS服务中最没有充分利用的服务。以下来看看它如何能够为企业的云计算基础设施提供无与伦比的可见性。

Linkerd是用于云原生应用程序的开源服务网格。可以使用Linkerd和Kubernetes构建可伸缩的弹性应用程序的完整指南。

CloudWatch是AWS最为低估的服务。这就像一个无人的控制室。所有的数据都在那里,但没有人在查看。

CloudWatch与IAM和VPC一起为现代基础设施提供了依据。CloudWatch结合了广泛的功能,也可以分为三个专用服务:度量标准,日志记录和事件。以下解释一下为什么人们应该更加认真对待CloudWatch,并充分利用这个控制室的原因。

  度量

度量表示一个时间序列,如CPU利用率,网络使用或AWS成本等,是一种度量值,可以存储数字数据和时间戳。大多数AWS服务都会将数据报告给CloudWatch,并将其分时汇总持续存在。用户可以按分钟检索数据,或者可以检索统计信息,例如10分钟总计,1天平均值,还可以检索1小时的平均数。

CloudWatch管理控制台提供了一种图形化方式来表示图表中的指标。下图显示了这样的图表。

除了向CloudWatch发送数据的许多AWS服务之外,用户还可以发送以所谓的自定义指标存储的数据。自定义指标与提供的AWS指标类似。唯一的区别是用户发送的数据(例如使用SDK或CLI)。

在最初的15天中,CloudWatch保存数据的以分钟来度量。接下来的48天,CloudWatch的度量值为5分钟。在接下来的392天,CloudWatch的度量值保持为1小时。之后(总共455天),数据被删除。

可用统计数据有:

·SampleCount:数据点数(实际值无关紧要)

·平均

·总和

·最小/最大

·百分位数(p0.0和p100之间的值)

p0.0应该是最小值

p50应该是中位数

p100应该是最大值

查看图表可能会有所帮助,但用户也可能希望自动执行此过程。

报警

CloudWatch警报会观察到一个指标。一旦度量标准(或度量的统计量)越过阈值,报警触发一个动作。一个流行的动作是向SNS主题发送消息。用户可以通过电子邮件订阅主题,以便在触发警报时收到通知。用户还可以触发放大操作,以自动对容量短缺做出反应或在Lambda功能中执行更复杂的逻辑。

基本报警如下图所示。

在定义警报时,用户还可以设置比阈值更复杂的规则。例如,用户可以指定必须连续多次达到阈值,以及如何解释丢失的数据。假设一下发送自定义指标的机器,当机器中断时,不再发布该指标,这应该是错误。另一方面,如果发生任何事情,用户可能只会发布一个指标,其中没有数据就意味着是零。

回到视觉效果,人类善于发现数据中的模式。让我们探索更好的可视化度量方法。

仪表板

 

这么多指标存储在CloudWatch中。但只有少数对用户很重要。为什么不在一个地方保留最重要的指标?这个地方可以在用户的团队中分享,其团队可以更好地了解运行中的基础设施,这是真正的动机。CloudWatch仪表板是一个可以完全配置为显示CloudWatch指标的24x24的电路板,可以显示度量的最新值,一个或多个指标的简单线形图或多个指标的堆叠区域图。所有指标都显示相同的时间范围。下图显示了一个仪表板。

  用户使用自定义指标和AWS提供的指标的组合。并与线图和堆叠区域图一起。

日志

CloudWatch Logs是一个存储和索引所有日志的地方。用户可以使用CloudWatchLogsAgent将EC2实例上的日志文件的内容直接传输到CloudWatch Logs中。日志被分组在所谓的组中,在一个组内,多个流捕获实际的日志数据。用户可以定义日志组的保留期限,以便在日志文件到期时删除日志文件。

用户可以使用全文搜索来搜索日志组,但如果知道日志的结构,还可以使用更多的结构化查询。

如果用户能自动观察日志,那不是很好吗?

度量过滤器

用户可以使用应用于所有传入日志数据的搜索查询来定义度量标准过滤器。如果查询与日志行匹配,则会为用户自定义度量。看看循环如何关闭的?定义自定义指标的警报,如果日志行与搜索查询匹配,用户就可以收到警报。

订阅过滤器

有时,度量标准过滤器的强度不够强大。如果需要执行更复杂的逻辑,则可以订阅日志组。查询匹配的每个条目:

·调用Lambda函数

·存储在Kinesis流中。用户可以使用Kinesis客户端库或Spark等大数据工具分析流

·存放在Kinesis Firehose中。Firehose可以提供给S3或Elasti Search,用户您可以在其中使用不同的工具来分析数据

事件

用户的AWS基础设施更改。一般总是资源被添加和删除。CloudWatch事件提供了一种对这些更改做出反应的方法。它提供了用户的AWS帐户的事件流,其中许多AWS服务发布事件。例如,EC2在实例状态发生变化(例如从运行到终止)时发布事件,管理控制台发布登录事件等等。

用户可能会问这与CloudTrail有什么不同?CloudWatch事件要快得多。CloudTrail记录用户的AWS帐户上的所有API活动,但只保证每15分钟交付一次。

与自定义指标一样,用户也可以发布自定义事件。

规则

CloudWatch事件规则与报警类似。该规则定义了用户感兴趣的是什么类型的事件,以及如果某个事件到达匹配条件时触发什么操作。用户可以再次向SNS主题发送消息,但也会触发Lambda函数来执行更严重的逻辑。

总线

CloudWatch事件总线是CloudWatch的最新的新功能。现在用户可以从另一个AWS帐户接收事件。发件人帐户创建一个规则,将事件转发到拥有总线的帐户。总线在多帐户设置中有意义。

概要

CloudWatch提供对运行基础设施的洞察。

·指标由AWS服务或用户的应用程序发布。它们可以包含附加到时间戳的各种数值。

·如果达到阈值,则警报将观察指标并触发操作。

·仪表板显示一组指标。

·日志将日志文件存储在一个中心位置。

·过滤器对日志执行连续查询,如果发现匹配,则触发操作。

·订阅过滤器提供了一种将日志转发到其他服务以进行分析的方法,例如Kinesis或Lambda。

·事件在用户的AWS帐户中提供近乎实时的更改流程

·如果事件与模式匹配,则规则触发操作

·总线可以从其他AWS帐户接收事件

·CloudWatch不处理通知和升级。用户需要第三方解决方案

希望用户现在坐在自己的AWS控制室内,查看它的价值。

关键字:度量值 服务网格

本文摘自:机房360

为什么CloudWatch控制室是空的? 扫一扫
分享本文到朋友圈

关于我们联系我们版权声明友情链接广告服务会员服务投稿中心招贤纳士

企业网版权所有©2010-2018 京ICP备09108050号-6

^