llama2-7b-128k
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
YaRN: RoPE + LLM으로 10배 적은 토큰과 2.5배 적은 학습 단계로 Context Window를 128k까지 확장하기 |
![]() |
0 | 1616 | 11월 5, 2023 |
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
YaRN: RoPE + LLM으로 10배 적은 토큰과 2.5배 적은 학습 단계로 Context Window를 128k까지 확장하기 |
![]() |
0 | 1616 | 11월 5, 2023 |