안녕하세요. 한 가지 질문을 여쭤보려고 글을 쓰게 되었습니다.
일반적으로 학습 시 backward() 함수를 통해 역전파를 수행 및 step()함수를 통해 weight를 업데이트 할 시, loss에 영향을 많이 주는 weight는 update가 자주, 큰 폭으로 변경되고 loss에 영향을 적게 주는 weight는 update가 적게, 적은 폭으로 변경되는 것으로 알고 있습니다.
제가 궁금한 점은 loss에 영향을 많이 미치는 것을 기준으로 weight를 업데이트 하지 않고 weight를 전체적으로 업데이트를 하는 방법에 대하여 알고 싶습니다.
상기의 내용이 궁금한 이유로는 현재 object detection 관련 작업을 진행하고 있는데 성능 향상을 위해 기존 RGB 이미지만 input으로 사용하던 것을 RGB+detection에 도움이 될 추가 정보를 input으로 사용하도록 변경하였고, 그에 따라 더 많은 weight들을 설정 및 학습하도록 네트워크를 수정하였습니다. 하지만 성능 측정 결과는 네트워크 구조를 변경하기 전의 성능이 더 좋게 나왔기 때문에 이를 분석하고자 위함입니다.
제 생각에는 추가한 weight들이 loss에 큰 영향을 미치지 않아 초기화 값에서 큰 변화가 없는 상태로 최종 output 모델에 적용이 되었을 것이라 생각합니다. 따라서, weight를 전체적으로 학습을 하게 된다면 loss값은 안 좋아질 수 있겠지만 mAP나 Accuracy 등의 성능은 더 좋을 것이라 생각하여 이와 같은 질문을 드리게 되었습니다. 만일, weight를 전체적으로 학습하였을 경우에도 성능이 좋지 않다면 input에 추가한 정보가 성능 저하를 일으킨다고 결론을 내릴 수 있을 것 같습니다.
결론적으로 loss에 영향을 미치는 정도를 기준으로 weight를 학습하는 것이 아닌 전체적인 weight를 학습하는 방안에 대해 알고 싶습니다.
감사합니다.