DeepSeek, 수학 정리 증명을 위한 DeepSeek-Prover-V2 모델 공개
|
|
0
|
279
|
5월 2, 2025
|
[2025/03/17 ~ 03/23] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
665
|
3월 24, 2025
|
DeepSeek-V3/R1 추론 시스템 개요 공개 (feat. DeepSeek OpenInfra)
|
|
0
|
518
|
3월 2, 2025
|
3FS(Fire-Flyer File System), 고성능 분산 파일 시스템 (feat. DeepSeek)
|
|
0
|
424
|
2월 28, 2025
|
FlashMLA: Hopper GPU를 위한 고성능 MLA 디코딩 커널 (feat. DeepSeek)
|
|
0
|
415
|
2월 24, 2025
|
DeepEP: 효율적인 Mixture-of-Experts 병렬 통신 라이브러리 (feat. DeepSeek)
|
|
0
|
337
|
2월 25, 2025
|
DeepGEMM: NVIDIA Hopper GPU에서 효율적인 FP8 연산을 위한 GEMM 커널 라이브러리 (feat. DeepSeek)
|
|
0
|
225
|
2월 26, 2025
|
EPLB: MoE 모델에서 GPU들 간의 부하를 분배(Load Balancing)하는 라이브러리 (feat. DeepSeek)
|
|
0
|
213
|
2월 27, 2025
|
DualPipe: 양방향 파이프라인 병렬화 알고리즘 (feat. DeepSeek)
|
|
0
|
290
|
2월 27, 2025
|
DeepSeek-V3/R1 모델 학습 및 추론 시 수집한 프로파일링 데이터 공개 (feat. DeepSeek)
|
|
0
|
778
|
2월 27, 2025
|
DeepSeek-R1, 지도학습 기반 파인튜닝(SFT) 대신, 강화학습(RL)으로 추론 능력을 개선하여 추론 능력을 강화한 대규모 언어 모델
|
|
2
|
5307
|
1월 29, 2025
|
DeepSeek, OpenAI의 o1-preview 수준의 벤치마크 성능을 보이는 R1-Lite-Preview 모델 공개 (& 오픈소스 예정)
|
|
1
|
713
|
11월 22, 2024
|
DeepSeek-V2: 강력하고 경제적이며 효율적인 전문가 혼합(MoE) 언어모델
|
|
0
|
1044
|
5월 15, 2024
|