파이토치 한국 사용자 모임
scaling-smart
글
댓글
조회수
활동
HyperCloning, 대규모 언어 모델을 더 빠르게 학습하기 위한 모델 가중치 초기화 방법에 대한 연구 (feat. Apple)
읽을거리&정보공유
apple
,
paper
,
knowledge-distillation
,
acceleration
,
hypercloning
,
weight-initialization
,
scaling-smart
0
150
10월 24, 2024