llama2-7b-64k
| 글 | 댓글 | 조회수 | 활동 | |
|---|---|---|---|---|
| YaRN: RoPE + LLM으로 10배 적은 토큰과 2.5배 적은 학습 단계로 Context Window를 128k까지 확장하기 |
|
0 | 2360 | 11월 5, 2023 |
| 글 | 댓글 | 조회수 | 활동 | |
|---|---|---|---|---|
| YaRN: RoPE + LLM으로 10배 적은 토큰과 2.5배 적은 학습 단계로 Context Window를 128k까지 확장하기 |
|
0 | 2360 | 11월 5, 2023 |