rope
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
Power Attention: Softmax Attention를 개선한 Symmetric Power Transformer 논문의 PyTorch 구현체 |
![]() |
0 | 118 | 1월 26, 2025 |
Jina AI, Embedding을 위한 jina-embeddings-v3 모델 공개 |
![]() |
0 | 736 | 9월 18, 2024 |
YaRN: RoPE + LLM으로 10배 적은 토큰과 2.5배 적은 학습 단계로 Context Window를 128k까지 확장하기 |
![]() |
0 | 1777 | 11월 5, 2023 |
[TLDR] 오늘의 AI 뉴스, 2023-11-03: 영국, 슈퍼컴퓨터에 2억 7,300만 달러 투자 🇬🇧, 이미지 분류를 위한 ChatGPT 🖼️, 공감을 위한 LLM 튜닝 😄 |
![]() |
1 | 265 | 12월 31, 2023 |