|
Unsloth AI, 자사의 Unsloth 프레임워크를 사용하여 Google Colab에서 DeepSeek-OCR 실행 및 파인튜닝하는 문서 공개
|
|
0
|
359
|
11월 15, 2025
|
|
DeepSeek-OCR: DeepSeek AI가 공개한 LLM 중심의 통합형 광학 문자 인식(OCR) 모델
|
|
0
|
4240
|
10월 21, 2025
|
|
DeepSeek, 수학 정리 증명을 위한 DeepSeek-Prover-V2 모델 공개
|
|
0
|
402
|
5월 2, 2025
|
|
[2025/03/17 ~ 03/23] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
940
|
3월 24, 2025
|
|
DeepSeek-V3/R1 추론 시스템 개요 공개 (feat. DeepSeek OpenInfra)
|
|
0
|
623
|
3월 2, 2025
|
|
3FS(Fire-Flyer File System), 고성능 분산 파일 시스템 (feat. DeepSeek)
|
|
0
|
589
|
2월 28, 2025
|
|
FlashMLA: Hopper GPU를 위한 고성능 MLA 디코딩 커널 (feat. DeepSeek)
|
|
0
|
521
|
2월 24, 2025
|
|
DeepEP: 효율적인 Mixture-of-Experts 병렬 통신 라이브러리 (feat. DeepSeek)
|
|
0
|
463
|
2월 25, 2025
|
|
DeepGEMM: NVIDIA Hopper GPU에서 효율적인 FP8 연산을 위한 GEMM 커널 라이브러리 (feat. DeepSeek)
|
|
0
|
436
|
2월 26, 2025
|
|
EPLB: MoE 모델에서 GPU들 간의 부하를 분배(Load Balancing)하는 라이브러리 (feat. DeepSeek)
|
|
0
|
470
|
2월 27, 2025
|
|
DualPipe: 양방향 파이프라인 병렬화 알고리즘 (feat. DeepSeek)
|
|
0
|
392
|
2월 27, 2025
|
|
DeepSeek-V3/R1 모델 학습 및 추론 시 수집한 프로파일링 데이터 공개 (feat. DeepSeek)
|
|
0
|
850
|
2월 27, 2025
|
|
DeepSeek-R1, 지도학습 기반 파인튜닝(SFT) 대신, 강화학습(RL)으로 추론 능력을 개선하여 추론 능력을 강화한 대규모 언어 모델
|
|
2
|
5712
|
1월 29, 2025
|
|
DeepSeek, OpenAI의 o1-preview 수준의 벤치마크 성능을 보이는 R1-Lite-Preview 모델 공개 (& 오픈소스 예정)
|
|
1
|
724
|
11월 22, 2024
|
|
DeepSeek-V2: 강력하고 경제적이며 효율적인 전문가 혼합(MoE) 언어모델
|
|
0
|
1147
|
5월 15, 2024
|