회사에서 multi label classfication을 수행하는 인공지능을 만들고 있습니다.
그런데 한글 text dataset을 가지고 잇는데 문제는 imbalance하다는 점입니다.
imbalance한 데이터의 전처리가 필요한데 imblearn 모듈이 있다는 것은 알고 있지만
이것을 text에 적용해도 되는지도 모르겠고, multi label에 사용해도 되는지도 모르겠습니다.
multi label classfication에 맞고, text에도 맞는 방법의 oversampling은 없는지 궁금합니다.