yolov5 실행을 하는데 에러코드가 나와 해결하고 싶습니다.

제가 yolov5를 모델을 통해 spalling 자국을 알아내는 모형을 할려고 합니다. 제가 사용한 이미지의 크기가 대개 3587*10000픽셀로 크기가 되게 큰 편입니다. 그래서 코드를
!python train.py --img 3616 --batch 1 --workers 2 --epoch 100 --data C:/Users/User1015/content/yolov5/data.yaml --cfg C:/Users/User1015/content/yolov5/models/yolov5l.yaml --weights yolov5l.pt --name road_spalling

넣고 돌리는데 torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 50.00 MiB (GPU 0; 8.00 GiB total capacity; 7.16 GiB already allocated; 0 bytes free; 7.27 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF 이 에러가 뜨네요.

그래서 방법을 찾아서 넣으면
OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.이게 나와서 계속 둘이 번갈아가면서 에러코드가 뜹니다! 이걸 어떻게 해결해야 되나요?

저는 참고로
tensorflow-gpu==2.10.0
cuda == 11.2
cuDNN == 8.1
NVIDIA GeForce RTX 2070 SUPER 를 사용합니다.

제 경험상은 GPU 메모리가 부족해서 생기는 현상입니다.

batch size가 이미 1인 상태에서 발생한 경우는 더 좋은 GPU 환경에서 코드를 실행시켜보는 방법밖에 당장은 떠오르지 않네요..

1개의 좋아요

아이고..이미지 사이즈를 줄이는 방법은 괜찮을까요? 당장 GPU 를 바꾸기에는 조금 힘들 거 같애서요.

네네 이미지를 줄여도 상관없는 상황이라면 크기를 조절해보시는게 좋은것 같습니다 :slight_smile:

1개의 좋아요