컴퓨터 환경은 다음과 같습니다.
OS : ubuntu 20.04
RAM : 64GB
GPU : RTX 4090
pytorch docker image : nvcr.io/nvidia/pytorch:22.11-py3
그리고 다음과 같은 명령어를 사용하여 jupyter로 테스트를 진행하고 있는데요
> docker run --gpus all --shm-size=4gb -it -v /mnt/ssd2:/storage -p 33333:33333 -d jupy:0 jupyter-lab
네트워크 크기가 크지않은 간단한 style transfer모델을 돌려봤는데 RTX-3080으로 돌렸을때보다 성능이 더 안나오는것 같은데요. 인터넷에 돌아다니는 벤치마크 결과를 보면 4090이 4배는 더 빨라야 정상인것 같은데 제가 무엇을 잘못한것일까요..
cpprhtn
(Junwon Lee)
2
비슷한 이슈 사례가 있긴하네요.
저도 정확한 이유는 모르겠지만 아직 cuda 등의 최적화가 안되어있는거 같다는 생각이 듭니다.
1개의 좋아요
system
(system)
에 닫힘
4
이 글은 마지막 댓글이 달린지 오래(30일)되어 자동으로 닫혔습니다. 댓글 대신 새로운 글을 작성해주세요! 