knowledge-distillation
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
HyperCloning, 대규모 언어 모델을 더 빠르게 학습하기 위한 모델 가중치 초기화 방법에 대한 연구 (feat. Apple) | 0 | 161 | 10월 24, 2024 | |
minitron: 15B -> 8B -> 4B 더 작고 효율적으로 정제한 모델 (feat. NVIDIA)\ | 0 | 397 | 8월 26, 2024 | |
[TLDR] 오늘의 AI 뉴스, 2023-09-22: 마이크로소프트 코파일럿 🤖, ML 엔지니어링 가이드 📚, 지식 증류를 이용한 소형 모델 만들기 🌐 | 1 | 249 | 12월 31, 2023 |