[ja] Translate tasks/debug-application-cluster/debug-cluster into Japanese #30874 (#31087)

* done

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update debug-cluster.md

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Apply suggestions from code review

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>

* Update debug-cluster.md

* Update content/ja/docs/tasks/debug-application-cluster/debug-cluster.md

Co-authored-by: Ryota Yamada <ryota10069.tech5.jizi@gmail.com>

Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>
Co-authored-by: Ryota Yamada <ryota10069.tech5.jizi@gmail.com>
pull/33124/head
Wang 2022-04-23 03:41:36 +09:00 committed by GitHub
parent 6613b13b65
commit 4b85c7b058
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
1 changed files with 114 additions and 0 deletions

View File

@ -0,0 +1,114 @@
---
title: クラスターのトラブルシューティング
content_type: concept
---
<!-- overview -->
このドキュメントはクラスターのトラブルシューティングに関するもので、あなたが経験している問題の根本原因として、アプリケーションをすでに除外していることを前提としています。
アプリケーションのデバッグのコツは、[application troubleshooting guide](/docs/tasks/debug-application-cluster/debug-application)をご覧ください。
また、[troubleshooting document](/docs/tasks/debug-application-cluster/troubleshooting/)にも詳しい情報があります。
<!-- body -->
## クラスターのリストアップ
クラスターで最初にデバッグするのは、ノードがすべて正しく登録されているかどうかです。
```shell
kubectl get nodes
```
そして、期待するノードがすべて存在し、それらがすべて `Ready` 状態であることを確認します。
クラスター全体の健全性に関する詳細な情報を得るには、以下を実行します。
```shell
kubectl cluster-info dump
```
## ログの確認
今のところ、クラスターをより深く掘り下げるには、関連するマシンにログインする必要があります。
以下は、関連するログファイルの場所です。
(systemdベースのシステムでは、代わりに `journalctl` を使う必要があるかもしれないことに注意してください)
### マスターノード
* `/var/log/kube-apiserver.log` - APIの提供を担当するAPIサーバーのログ
* `/var/log/kube-scheduler.log` - スケジューリング決定責任者であるスケジューラーのログ
* `/var/log/kube-controller-manager.log` - レプリケーションコントローラーを管理するコントローラーのログ
### ワーカーノード
* `/var/log/kubelet.log` - ード上でコンテナの実行を担当するKubeletのログ
* `/var/log/kube-proxy.log` - サービスのロードバランシングを担うKube Proxyのログ
## クラスター障害モードの一般的な概要
これは、問題が発生する可能性のある事柄と、問題を軽減するためにクラスターのセットアップを調整する方法の不完全なリストです。
### 根本的な原因
- VMのシャットダウン
- クラスター内、またはクラスターとユーザー間のネットワークパーティション
- Kubernetesソフトウェアのクラッシュ
- データの損失や永続的ストレージ(GCE PDやAWS EBSボリュームなど)の使用不能
- Kubernetesソフトウェアやアプリケーションソフトウェアの設定ミスなど、オペレーターのミス
### 具体的なシナリオ
- apiserver VMのシャットダウンまたはapiserverのクラッシュ
- 新しいPod、サービス、レプリケーションコントローラの停止、更新、起動ができない
- Kubernetes APIに依存していない限り、既存のPodやサービスは正常に動作し続けるはずです
- apiserverのバックアップストレージが失われた
- apiserverが立ち上がらない
- kubeletsは到達できなくなりますが、同じPodを実行し、同じサービスのプロキシを提供し続けます
- apiserverを再起動する前に、手動でapiserverの状態を回復または再現する必要がある
- サポートサービス(ノードコントローラ、レプリケーションコントローラーマネージャー、スケジューラーなど)VMのシャットダウンまたはクラッシュ
- 現在、これらはapiserverとコロケーションしており、使用できない場合はapiserverと同様の影響があります
- 将来的には、これらも複製されるようになり、同じ場所に配置されない可能性があります
- 独自の永続的な状態を持っていない。
- 個別ノード(VMまたは物理マシン)のシャットダウン
- そのード上のPodの実行を停止
- ネットワークパーティション
- パーティションAはパーティションBのードがダウンしていると考え、パーティションBはapiserverがダウンしていると考えています。(マスターVMがパーティションAで終了したと仮定)
- Kubeletソフトウェア障害
- クラッシュしたkubeletがード上で新しいPodを起動できない
- kubeletがPodを削除するかどうか
- ノードが不健全と判定される
- レプリケーションコントローラーが別の場所で新しいPodを起動する
- クラスターオペレーターエラー
- PodやServiceなどの損失
- apiserverのバックエンドストレージの紛失
- ユーザーがAPIを読めなくなる
- その他
### 軽減策
- 対処法: IaaSプロバイダーの自動VM再起動機能をIaaS VMに使用する
- 異常: Apiserver VMのシャットダウンまたはApiserverのクラッシュ
- 異常: サポートサービスのVMシャットダウンまたはクラッシュ
- 対処法: IaaSプロバイダーの信頼できるストレージ(GCE PDやAWS EBSボリュームなど)をapiserver+etcdを使用するVMに使用する
- 異常: Apiserverのバックエンドストレージが失われる
- 対処法: [高可用性](/docs/setup/production-environment/tools/kubeadm/high-availability/)構成を使用します
- 異常: コントロールプレーンノードのシャットダウンまたはコントロールプレーンコンポーネント(スケジューラー、APIサーバー、コントローラーマネージャー)のクラッシュ
- 1つ以上のードまたはコンポーネントの同時故障に耐えることができる
- 異常: APIサーバーのバックアップストレージ(etcdのデータディレクトリーなど)が消失
- HA(高可用性) etcdの構成を想定しています
- 対処法: apiserver PDs/EBS-volumesを定期的にスナップショットする
- 異常: Apiserver のバックエンドストレージが失われる
- 異常: 操作ミスが発生する場合がある
- 異常: Kubernetesのソフトウェアに障害が発生する場合がある
- 対処法レプリケーションコントローラーとServiceをPodの前に使用する
- 異常: ノードのシャットダウン
- 異常: Kubeletソフトウェア障害
- 対処法: 予期せぬ再起動に耐えられるように設計されたアプリケーション(コンテナ)
- 異常: ノードのシャットダウン
- 異常: Kubeletソフトウェア障害