DeepSeek-V3/R1 추론 시스템 개요 공개 (feat. DeepSeek OpenInfra)
|
|
0
|
379
|
3월 2, 2025
|
Frames of Mind: R1 모델의 사고 과정을 임베딩과 차원 축소(t-SNE)를 통해 시각화하는 프로젝트
|
|
0
|
230
|
2월 19, 2025
|
TinyZero: RL을 활용한 모델의 자가 검증 및 탐색 능력 학습 프로젝트 (feat. DeepSeek-R1)
|
|
0
|
297
|
2월 16, 2025
|
deepseek.cpp: 순수 C++로 작성한, 2천줄 미만의 CPU 전용 DeepSeek-V2/V2.5/V3/R1 모델 추론 엔진
|
|
0
|
601
|
2월 8, 2025
|
Minimal-R1, H100 서버 1대에서 효율적으로 DeepSeek-R1 모델을 재현하기 위한 프로젝트
|
|
0
|
482
|
1월 31, 2025
|
Ollama Deep Researcher: Local LLM을 활용한 Web Research Assistant (feat. LangChain)
|
|
0
|
388
|
1월 28, 2025
|
DeepSeek-R1, 지도학습 기반 파인튜닝(SFT) 대신, 강화학습(RL)으로 추론 능력을 개선하여 추론 능력을 강화한 대규모 언어 모델
|
|
2
|
4933
|
1월 29, 2025
|
🤗 Open R1, DeepSeek-R1을 재현하는 것을 목표로 하는 오픈소스 프로젝트 (feat. Hugging Face)
|
|
1
|
655
|
1월 28, 2025
|
[2025/01/20 ~ 01/27] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
450
|
1월 27, 2025
|
DeepSeek, OpenAI의 o1-preview 수준의 벤치마크 성능을 보이는 R1-Lite-Preview 모델 공개 (& 오픈소스 예정)
|
|
1
|
699
|
11월 22, 2024
|