파이토치 한국 사용자 모임
zero-3
글
댓글
조회수
활동
[GN] DeepSpeed Ulysses: 긴 시퀀스 트랜스포머 모델 학습을 위한 시스템 최적화
읽을거리&정보공유
geeknews
,
deepspeed
,
deepspeed-ulysses
,
zero-3
0
228
8월 31, 2023