Ssoon

[1주차] CHAPTER-05 쿠버네티스 트러블슈팅 본문

Production Kubernetes Online Study

[1주차] CHAPTER-05 쿠버네티스 트러블슈팅

구구달스 2023. 3. 10. 02:47
이정훈님이 집필하신 "24단계 실습으로 정복하는 쿠버네티스" 로 진행하는 CloudNet@ 팀의 PKOS 1주차 정리입니다.

📌 Apply -> Get -> Describe -> Logs -> Get event

  yaml 파일로 오브젝트 apply 하고 생성한 오브젝트 리스트를 get 으로 확인합니다.

  상세한 설정 정보는 describe 로 확인합니다.

  애플리케이션 관련 로그는 logs 로 확인하고 쿠버네티스 클러스터 관련 로그는 get event 로 확인합니다.

  기본 에러 조치 프로세스

💠 잘못된 버전의 NGINX 이미지 yml파일로 Pod를 생성합니다.

  ImagePullBackOff : 이미지를 가져오는 데 실패

💠 describe 을 통해 상세정보를 확인합니다.

💠 에러 메시지를 확인합니다.

Failed to pull image "nginx:1.19.19": rpc error: code = NotFound desc = failed to pull and unpack image "docker.io/library/nginx:1.19.19": failed to resolve reference "docker.io/library/nginx:1.19.19": docker.io/library/nginx:1.19.19: not found

 

💠 yaml 파일의 이미지 버전을 수정하고 기존 pod는 삭제합니다. 그리고 Pod를 재배포합니다.

💠 k logs -f 로 실시간으로 로그를 확인할 수 있습니다.

💠 k get events 클러스터 전체의 이밴트를 확인 할 수 있습니다.

💠 -n 네임스페이스 이름, -A 전체 네임스페이스 을 통해 다양한 이벤트를 확인 할 수 있습니다.

  장애 처리 사례 - 호스트 노드의 파일 시스템 용량 초과

💠 YAML 파일을 이용해 10개의 Pod를 생성합니다.

💠 2번 노드에 접속하여 디스크 정보를 확인합니다.

💠 fallocate 을 통해 30g 크기의 파일을 생성합니다.

💠 2번 노드의 Pod 가 사라지고 새로운 노드에 Pod가 생성됩니다.

📌 쿠버네티스는 항상 의도한 상태로 유지하기 때문에 특정 노드에 문제가 생기면 다른 노드로 자동으로 이동합니다.

💠 k events 정보로 에러 로그를 확인합니다.

💠 노드에서도 에러 메시지를 확인합니다.

💠 deployment 를 삭제합니다.

Comments