파이토치 한국 사용자 모임
llama2-13b-64k
글
댓글
조회수
활동
YaRN: RoPE + LLM으로 10배 적은 토큰과 2.5배 적은 학습 단계로 Context Window를 128k까지 확장하기
읽을거리&정보공유
llm
,
paper
,
long-context
,
rope
,
mistral-7b-128k
,
yarn
,
llama2-7b-64k
,
llama2-13b-128k
,
llama2-13b-64k
,
llama2-7b-128k
0
1398
11월 5, 2023