如何對處於 INSUFFICIENT_DATA 狀態的 CloudWatch 警示進行疑難排解?

1 分的閱讀內容
0

我想對處於 INSUFFICIENT_DATA 狀態的 Amazon CloudWatch 警示進行疑難排解。

簡短描述

當您建立 CloudWatch 警示時,其所處的第一個狀態為 INSUFFICIENT_DATA。它會保持在此狀態,直到完成監控的指標的第一次評估為止。通常,警示會在建立後的幾分鐘內從 INSUFFICIENT_DATA 狀態轉換出來。這是指標的正常行為。

以下是使 CloudWatch 警示保持在 INSUFFICIENT_DATA 狀態的可能原因:

  • 指標遺失資料點。
  • 指標參數設定錯誤。
  • 警示期間設定錯誤。
  • 由於連線不足,資料點的交付延遲

解決方法

若要對處於 INSUFFICIENT_DATA 狀態的 CloudWatch 警示進行疑難排解,請檢查下列可能的原因:

指標遺失資料點

當您具有監控基礎設施變更、網路故障和服務中斷等事件的指標時,此指標不會定期報告資料點。如果警示在指定的時段內沒有指標資料點,則資料點會遺失,且警示狀態為 INSUFFICIENT_DATA

若要解決遺失資料點導致的 INSUFFICIENT_DATA 狀態,請確定您設定警示處理遺失資料點的方式。使用 notBreaching 參數將遺失資料點處理為良好且在閾值內,或使用 ignore 參數來維持目前警示狀態。如需詳細資訊,請參閱設定 CloudWatch 警示處理遺失資料的方式

指標參數設定錯誤

每個指標均由命名空間、指標名稱和最多 30 個維度定義。擷取資料點時,必須指定時間戳記,以及選擇性地指定單位。如果您為其中一個參數提供了不正確的值,CloudWatch 會嘗試擷取不存在的指標。這會產生一個空資料集。

**注意:**資料點通常會推送至具有單一單位的指標。建立警示時,您不需要指定單位。此外,如果您未指定單位,則不會遇到組態問題。在您的指標資料點具有多個單位時,最佳實務是使用正確的單位。

若要解決由設定錯誤的參數導致的 INSUFFICIENT_DATA 狀態,請完成下列步驟:

  1. 執行 DescribeAlarms API 命令以取得受監控指標的完整參數清單。
  2. 執行 ListMetrics API 命令。將 ListMetrics 輸出與受監控指標的參數清單進行比較。
  3. 檢查指標參數是否有拼字錯誤、不當使用小寫和大寫字母,以及維度錯誤或遺失。

警示期間設定錯誤

您可以設定警示,以您所需的頻率擷取資料點。但是,如果您使用的期間比服務或來源使用的期間更短,則可能會出現不需要的警示狀態。若要解決此問題,請將警示的期間設定為大於或等於推送指標資料點的期間。此外,您可以將警示設定為使用 N 中的 M 設定。如需詳細資訊,請參閱評估警示

由於連線不足,資料點的交付延遲

如果您已設定標準警示,警示會每分鐘評估一次您的指標。評估指標時,警示會從設定的指標擷取可用的資料點。如果在警示評估指標時沒有連線,警示無法擷取資料點或將其交付至 CloudWatch。這會調用 INSUFFICIENT_DATA 狀態。

連線還原後,包含時間戳記的資料點的待辦項目將傳送至 CloudWatch。在延遲之後傳送資料點時,警示會根據指定的期間和評估期間擷取最近的資料點。此外,指標中的空格不再是空白,且資料點會儲存在 CloudWatch 中。但是,警示已評估該時間範圍,而警示歷史記錄仍然指標 INSUFFICIENT_DATA 狀態,以及類似下列內容的錯誤訊息:

"stateValue": "INSUFFICIENT_DATA",
   "stateReason": "Insufficient Data: 2 datapoints were unknown."

若要解決資料點交付延遲導致的 INSUFFICIENT_DATA 狀態,請設定 CloudWatch 警示處理遺失資料的方式

AWS 官方
AWS 官方已更新 6 個月前