Jupyter notebook 커널 죽음

anaconda 사용중이며 Jupyter notebook에서 pytorch를 사용할 때 가끔씩 kernel이 죽었다고 메세지가 뜹니다. 그럴때마다 컴퓨터에 파이토치를 지우고 ```
pip3 install torch torchvision

어떻게 해결해야하나요?
  • 아래 답변은 OpenAI의 ChatGPT로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
  • 잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다. :sweat_smile:

Jupyter Notebook에서 kernel이 죽는 것은 여러 가지 이유가 있을 수 있습니다. PyTorch를 사용하는 경우라면, 일반적으로 다음과 같은 원인이 있을 수 있습니다.

  1. 데이터가 너무 커서 memory error가 발생한 경우
  2. 잘못된 코드로 인해 infinite loop가 발생한 경우
  3. GPU 메모리 부족으로 인한 문제
  4. 다른 프로세스가 시스템 자원을 모두 사용해서 kernel이 비정상 종료되는 경우

위와 같은 문제들을 일으키는 코드를 실행할 때는 Jupyter notebook 대신 PyCharm과 같은 IDE를 사용하거나, Terminal에서 코드를 실행하는 것이 좋습니다. 코드를 실행할 때 GPU 메모리 사용량이 높아지는 경우에는 torch.cuda.empty_cache() 코드를 추가하여 메모리를 비워주는 것도 도움이 될 수 있습니다.

만약 kernel이 종료되었다는 메시지가 나타난다면, 다시 시작하기 전에 먼저 Jupyter notebook을 종료하고, conda update --all 명령어로 모든 패키지를 최신 버전으로 업데이트하거나, conda clean --all 명령어로 캐시를 지우는 것도 해결책 중 하나입니다.

PyTorch 관련하여 추가적인 정보는 PyTorch 공식 페이지의 튜토리얼 Welcome to PyTorch Tutorials — PyTorch Tutorials 1.13.1+cu117 documentation 에서 확인할 수 있습니다.


  • 답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 :heart:를 한 번 눌러주세요!

커널이 죽는 이유는 여러가지지만 대부분 RAM이 모자라거나 ssh 연결일 경우 network 상태가 안좋아서 끊깁니다.
GPU가 이미 할당 되어있다면

nvidia-smi

sudo kill -9 [PID]

로 할당된 작업을 종료시켜주시면 됩니다.

1개의 좋아요