안녕하세요. 최근 자연어 처리 분야에 관심이 생겨 공부를 시작한 초보 대학생입니다. 이번 포스팅에서는 제가 자연어 처리 공부를 입문하는 데 있어 도움을 받았던 도서와 강의를 소개하고 개인적으로 정리해 보고자 글을 쓰게 되었습니다.
혹시 아래 적은 것들 이외에 좋은 자료가 있으면 댓글로 추천 부탁드립니다ㅎㅎ
- 고려 대학교 DSBA 연구실 강필성 교수님 강의 ( 01-1: Introduction to Text Analytics - Part 1 (youtube.com))
먼저 유튜브에 업로드되어 있는 강의입니다. NLP에 대한 기초적인 지식과 전반적인 개요가 설명되어 입문자에게 추천드립니다. 또한, 고전적인 모델(Word2Vec, GloVe, LDA, Transformer)의 기본적인 수학적 메커니즘 또한 포함되어 있기 때문에 모델을 이해하는 데 더욱 도움이 되었던 것 같습니다. 강의를 처음 들었을 때에는 다소 어려움이 있었지만, 다시 한번 정주행 하니 새로운 이해를 할 수 있었습니다. 자연어 처리 기초에 대한 학습을 하고자 하는 분들께 추천드립니다.
- 스탠포드 대학교 자연어처리 강의 ( CS 224N | Home (stanford.edu))
다음으로는 Stanford 대학교 웹사이트에 업로드 된 강의입니다. 강의가 영어로 진행되는 점만 제외하고는 좋은 강의였던 것 같습니다. 특히 기초적인 수학적 메커니즘, 모델 별로 그레디어트를 계산하고 유도하는 과정이 자세하게 다루어져 있어서 많은 도움이 되었습니다.
- 도서 <파이토치 트랜스포머를 활용한 자연어 처리와 컴퓨터 비전 심층 학습> ( 파이토치 트랜스포머를 활용한 자연어 처리와 컴퓨터비전 심층학습 | 윤대희 - 교보문고 (kyobobook.co.kr))
마지막으로는 제가 모델 실습을 할 때 도움을 받았던 도서입니다. 앞서 말씀 드린 두 강의로 자연어 처리에 대한 이론과 기초를 공부하였고, 이후 모델을 직접 구현해보고 파이토치를 공부해보고자 하였습니다. 저는 파이토치를 처음 접해봤기에 많은 어려움이 있을 줄 알았지만, 해당 도서에는 파이토치의 기초 개념, 문법, 라이브러리 설명이 되어있어 쉽게 따라갈 수 있었던 것 같습니다. 여러 고전적 모델에 대한 실습 코드가 있으며, 웹 프레임워크와 Docker를 활용한 API 온라인 서빙, 데모 에플리케이션 구축까지 경험할 수 있어서 좋았습니다.