設定檔適用性:等級 2
處於降級狀態的節點是未知數,因此可能構成安全風險。
Kubernetes Engine 的節點自動修復功能可幫助您保持叢集中的節點處於正常運行狀態。啟用後,Kubernetes Engine 會定期檢查叢集中每個節點的健康狀態。如果某個節點在延長的時間範圍內連續未通過健康檢查,Kubernetes
Engine 會啟動該節點的修復過程。
![]() |
注意節點自動修復預設已啟動。
|
影響
如果多個節點需要修復,Kubernetes Engine 可能會並行修復它們。Kubernetes Engine 會根據叢集的大小(較大的叢集有較高的限制)和叢集中損壞節點的數量(如果有許多節點損壞,限制會減少)來限制修復的數量。
節點自動修復在 Alpha 叢集上不可用。
稽核
使用 Google 雲端主控台:
- 前往Kubernetes Engine 網站。
- 從叢集列表中,選擇所需的叢集。對於每個節點池,查看節點池詳細資訊窗格,並確保在管理標題下,自動修復設為
已啟動
。
使用命令列:
要檢查現有叢集的節點池是否存在自動修復,請執行:
gcloud container node-pools describe <node_pool_name> --cluster <cluster_name> --zone <compute_zone> --format json | jq '.management'
確保上述命令的輸出中,JSON 鍵屬性
autoRepair
設定為 true
:{ "autoRepair": true }
補救
使用 Google 雲端主控台:
- 前往Kubernetes Engine 網站。
- 選擇包含已停用自動修復的節點池的 Kubernetes 叢集。
- 透過點擊資源池的名稱來選擇節點池。
- 導航至節點池詳細資訊窗格並點擊EDIT。
- 在管理標題下,勾選Enable auto-repair框。
- 按一下「SAVE」。
- 對於每個已停用自動升級的叢集和節點池,重複步驟2-6。
使用命令列:
要為現有叢集的節點池啟用節點自動修復:
gcloud container node-pools update <node_pool_name> --cluster <cluster_name> --zone <compute_zone> --enable-autorepair