acceleration
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
PiToMe: 사용하지 않는 토큰을 병합하여 Transformer 모델의 효율성을 높이는 기법에 대한 연구 | 0 | 175 | 11월 5, 2024 | |
HyperCloning, 대규모 언어 모델을 더 빠르게 학습하기 위한 모델 가중치 초기화 방법에 대한 연구 (feat. Apple) | 0 | 150 | 10월 24, 2024 | |
attorch: PyTorch의 nn 모듈을 OpenAI의 Triton을 사용하여 재작성하는 프로젝트 | 0 | 408 | 4월 14, 2024 |