檢視次數:
設定檔適用性:等級 2
處於降級狀態的節點是未知數,因此可能構成安全風險。
Kubernetes Engine 的節點自動修復功能可幫助您保持叢集中的節點處於正常運行狀態。啟用後,Kubernetes Engine 會定期檢查叢集中每個節點的健康狀態。如果某個節點在延長的時間範圍內連續未通過健康檢查,Kubernetes Engine 會啟動該節點的修復過程。
注意
注意
節點自動修復預設已啟動。

影響

如果多個節點需要修復,Kubernetes Engine 可能會並行修復它們。Kubernetes Engine 會根據叢集的大小(較大的叢集有較高的限制)和叢集中損壞節點的數量(如果有許多節點損壞,限制會減少)來限制修復的數量。
節點自動修復在 Alpha 叢集上不可用。

稽核

使用 Google 雲端主控台:
  1. 前往Kubernetes Engine 網站
  2. 從叢集列表中,選擇所需的叢集。對於每個節點池,查看節點池詳細資訊窗格,並確保在管理標題下,自動修復設為已啟動
使用命令列:
要檢查現有叢集的節點池是否存在自動修復,請執行:
gcloud container node-pools describe <node_pool_name> --cluster 
<cluster_name> --zone <compute_zone> --format json | jq '.management'
確保上述命令的輸出中,JSON 鍵屬性 autoRepair 設定為 true
{ 
    "autoRepair": true 
}

補救

使用 Google 雲端主控台:
  1. 前往Kubernetes Engine 網站
  2. 選擇包含已停用自動修復的節點池的 Kubernetes 叢集。
  3. 透過點擊資源池的名稱來選擇節點池。
  4. 導航至節點池詳細資訊窗格並點擊EDIT
  5. 在管理標題下,勾選Enable auto-repair框。
  6. 按一下「SAVE」。
  7. 對於每個已停用自動升級的叢集和節點池,重複步驟2-6。
使用命令列:
要為現有叢集的節點池啟用節點自動修復:
gcloud container node-pools update <node_pool_name> --cluster <cluster_name> 
--zone <compute_zone> --enable-autorepair