Ssoon
[1주차] CHAPTER-05 쿠버네티스 트러블슈팅 본문
이정훈님이 집필하신 "24단계 실습으로 정복하는 쿠버네티스" 로 진행하는 CloudNet@ 팀의 PKOS 1주차 정리입니다.
📌 Apply -> Get -> Describe -> Logs -> Get event
✔ yaml 파일로 오브젝트 apply 하고 생성한 오브젝트 리스트를 get 으로 확인합니다.
✔ 상세한 설정 정보는 describe 로 확인합니다.
✔ 애플리케이션 관련 로그는 logs 로 확인하고 쿠버네티스 클러스터 관련 로그는 get event 로 확인합니다.
✅ 기본 에러 조치 프로세스
💠 잘못된 버전의 NGINX 이미지 yml파일로 Pod를 생성합니다.
✔ ImagePullBackOff : 이미지를 가져오는 데 실패
💠 describe 을 통해 상세정보를 확인합니다.
💠 에러 메시지를 확인합니다.
Failed to pull image "nginx:1.19.19": rpc error: code = NotFound desc = failed to pull and unpack image "docker.io/library/nginx:1.19.19": failed to resolve reference "docker.io/library/nginx:1.19.19": docker.io/library/nginx:1.19.19: not found
💠 yaml 파일의 이미지 버전을 수정하고 기존 pod는 삭제합니다. 그리고 Pod를 재배포합니다.
💠 k logs -f 로 실시간으로 로그를 확인할 수 있습니다.
💠 k get events 클러스터 전체의 이밴트를 확인 할 수 있습니다.
💠 -n 네임스페이스 이름, -A 전체 네임스페이스 을 통해 다양한 이벤트를 확인 할 수 있습니다.
✅ 장애 처리 사례 - 호스트 노드의 파일 시스템 용량 초과
💠 YAML 파일을 이용해 10개의 Pod를 생성합니다.
💠 2번 노드에 접속하여 디스크 정보를 확인합니다.
💠 fallocate 을 통해 30g 크기의 파일을 생성합니다.
💠 2번 노드의 Pod 가 사라지고 새로운 노드에 Pod가 생성됩니다.
📌 쿠버네티스는 항상 의도한 상태로 유지하기 때문에 특정 노드에 문제가 생기면 다른 노드로 자동으로 이동합니다.
💠 k events 정보로 에러 로그를 확인합니다.
💠 노드에서도 에러 메시지를 확인합니다.
💠 deployment 를 삭제합니다.
'Production Kubernetes Online Study' 카테고리의 다른 글
[2주차] CHAPTER-07 쿠버네티스 서비스 사용하기 (0) | 2023.03.14 |
---|---|
[1주차] CHAPTER-06 헬름 기반으로 애플리케이션 설치 (0) | 2023.03.10 |
[1주차] CHAPTER-04 YAML파일를 이용한 오브젝트 관리 (0) | 2023.03.10 |
[1주차] CHAPTER-03 쿠버네티스 주요 오브젝트 (0) | 2023.03.10 |
[1주차] CHAPTER-02 효율적인 쿠버네티스 클러스터 관리 (0) | 2023.03.10 |