pytorch docker 실행 성능 관련 질문입니다.

컴퓨터 환경은 다음과 같습니다.

OS : ubuntu 20.04
RAM : 64GB
GPU : RTX 4090
pytorch docker image : nvcr.io/nvidia/pytorch:22.11-py3

그리고 다음과 같은 명령어를 사용하여 jupyter로 테스트를 진행하고 있는데요
> docker run --gpus all --shm-size=4gb -it -v /mnt/ssd2:/storage -p 33333:33333 -d jupy:0 jupyter-lab

네트워크 크기가 크지않은 간단한 style transfer모델을 돌려봤는데 RTX-3080으로 돌렸을때보다 성능이 더 안나오는것 같은데요. 인터넷에 돌아다니는 벤치마크 결과를 보면 4090이 4배는 더 빨라야 정상인것 같은데 제가 무엇을 잘못한것일까요…

비슷한 이슈 사례가 있긴하네요.
저도 정확한 이유는 모르겠지만 아직 cuda 등의 최적화가 안되어있는거 같다는 생각이 듭니다.

1개의 좋아요

답변 감사합니다~

이 글은 마지막 댓글이 달린지 오래(30일)되어 자동으로 닫혔습니다. 댓글 대신 새로운 글을 작성해주세요! :slight_smile: