如何對導致 Lightsail 執行個體無回應的常見問題進行疑難排解?

1 分的閱讀內容
0

我的 Amazon Lightsail 執行個體無回應。我想知道這些問題的原因以及如何進行疑難排解。

簡短描述

如果執行個體無回應,請檢閱執行個體指標以確定如何疑難排解。Lightsail 使用兩個狀態檢查指標來監控執行個體運作狀態:

**系統狀態檢查:**偵測執行個體執行所在的基礎主機的問題。如果基礎主機因網路、硬體或軟體問題而無回應或無法連線,此狀態檢查會失敗。

**執行個體狀態檢查:**指示作業系統層級問題或資源使用率過高。

解決方法

系統狀態檢查失敗

如果系統狀態檢查失敗,請停止並啟動執行個體,以將執行個體遷移至新的運作狀態良好的主機。

**注意:**停止並啟動不等同於重新開機。需要啟動才能將執行個體遷移至運作狀態良好的硬體。

**警告:**每次停止並啟動執行個體時,執行個體的公有 IP 位址都會變更。如果您不希望公有 IP 位址在每次停止並啟動時都變更,請在停止執行個體之前附加靜態 IP 位址

執行個體狀態檢查失敗

如果執行個體狀態檢查失敗,則可能是由於作業系統層級問題,導致開機錯誤或執行個體資源過度使用。以下是常見原因:

作業系統層級問題

可能導致執行個體無回應的作業系統層級問題包括開機失敗、核心程序危急、網路失敗、未正確掛載磁碟區,以及驅動程式不相容。此外,可能存在區塊型儲存設備錯誤、軟體錯誤,任務卡住或檔案系統問題。若要解決這些問題,請重新啟動或停止並啟動執行個體。如果重新啟動或停止並啟動無法解決問題,您可能需要將 Lightsail 伺服器遷移至 Amazon EC2 以進行進一步疑難排解。

高 CPU 使用率

高 CPU 使用率、執行個體記憶體耗盡和磁碟已滿是資源過度使用的常見原因。

檢視執行個體的 CPU 使用率指標。請注意 CPU 使用率是否高於永續區域。這意味著您的執行個體已達到高載容量,並且處於重負載。

如果執行個體達到高載容量,請使用下列方法進行疑難排解:

  • 重新啟動執行個體,使其恢復至運作良好的狀態。
    **注意:**如果您的執行個體 CPU 需求高於目前 Lightsail 計畫提供的需求,重新啟動後會再次發生此問題。
  • 變更為符合 CPU 需求的 Lightsail 計畫

記憶體耗盡

在記憶體耗盡時,核心沒有足夠的記憶體來執行。發生這種情況時,其他程序會停止以釋放記憶體,且執行個體會變得沒有回應。若要減少記憶體用量,請重新啟動或停止並啟動執行個體。

磁碟已滿錯誤

如果根裝置已滿且檔案系統達到容量,執行個體可能會進入緊急模式。若要解決此問題,請增加 Lightsail 計畫,或將您的計畫與具有較大磁碟區大小的計畫捆綁在一起。

若要將 Lightsail 計畫升級為較大的執行個體,請完成下列步驟:

  1. 建立執行個體的快照

  2. 從快照建立較大的執行個體

  3. 連線至您的執行個體。

  4. 執行 lsblk 命令以檢查磁碟佈局。即使磁碟空間增加,也可能缺乏可用空間。在缺乏可用空間時,增加分區和檔案系統的自動程序不會執行。如果發生這種情況,請釋放一些空間,手動增加分區,然後增加檔案系統。

    若要擴增根分區或分區 1 的大小,請執行 growpart 命令:

    $ sudo growpart /dev/xvda 1

    若要確認分區 1 已擴增,請執行 lsblk 命令:

    $ lsblk

    執行下列命令以擴增檔案系統並確認您的根分區是 "/":

    $ lsblk -f

    執行下列命令以在分區 1 上擴增 EXT2/EXT3/EXT4 檔案系統:

    $ sudo resize2fs /dev/xvda1

    執行下列命令以擴增 XFS 類型檔案系統。在此命令中,"/" 是磁碟區掛載點。

    $ sudo xfs_growfs -d /

    擴增檔案系統之後,執行 df -h 命令以確認作業系統辨識額外的空間:

    $ df -h

相關資訊

從匯出的 Lightsail 快照建立 Amazon EC2 執行個體

AWS 官方
AWS 官方已更新 8 個月前