들어가며 

DeepSeek에서 이번 주, 하루에 하나씩, 인프라와 관련한 GitHub 저장소를 공개하기로 하였습니다. 오늘은 5번째이자 마지막 날로, 모델 학습 및 추론을 위한 고성능 분산 파일 시스템인 3FS가 공개되었습니다.
3FS 소개
Deepseek AI가 개발 및 공개한 3FS는 Fire-Flyer File System의 약자로, 대규모 데이터 처리와 AI 모델 학습 및 추론을 위해 최적화된 고성능 분산 파일 시스템입니다. 특히, 특히 SSD와 RDMA 네트워크를 활용해 고성능/고속의 데이터 읽기/쓰기가 가능하며, 대규모 클러스터에서도 일관된 성능과 유연성을 제공합니다.
3FS 프로젝트의 목적은 데이터 로딩, 체크포인트, AI 추론 등의 작업을 더 빠르고 효율적으로 수행할 수 있도록 지원하는 것으로, 주요 특징은 다음과 같습니다:
-
분리형(disaggregated) 아키텍처: 다수의 SSD와 스토리지 노드를 활용해 병목 없는 데이터 처리 가능
-
강력한 일관성(Strong Consistency): Chain Replication with Apportioned Queries (CRAQ) 방식으로 데이터 정합성을 유지
-
표준 파일 인터페이스 지원: FoundationDB 기반의 트랜잭션 키-값 저장소를 활용하여 기존 스토리지 API를 그대로 사용 가능
기존의 NFS나 오브젝트 스토리지와 비교해보면, 3FS는 AI 모델 학습 및 데이터 분석을 위해 설계된 것이 특이점입니다. 특히, RDMA 네트워크와 SSD의 조합으로 속도와 일관성을 동시에 유지할 수 있습니다:
기능 | 3FS | 기존 NFS | Object Storage (S3 등) |
---|---|---|---|
성능 | 초고속 SSD 및 RDMA 활용 | 네트워크 속도에 의존 | 대체로 낮음 |
일관성 | 강력한 일관성 (CRAQ) | 보통 | 최종적 일관성 (Eventually Consistent) |
데이터 접근 | POSIX 인터페이스 제공 | POSIX | API 기반 |
대규모 처리 | AI 학습 및 추론에 최적화 | 범용 | 데이터 저장 중심 |
3FS의 주요 기능
-
데이터 준비: 데이터 분석 파이프라인의 출력을 계층적 디렉토리 구조로 정리하고 대량의 중간 결과를 효율적으로 관리
-
데이터 로딩 (Dataloaders): AI 학습을 위한 데이터셋을 랜덤 액세스 방식으로 제공하여 데이터 프리페칭이 필요하지 않으며, GPU 및 CPU 노드 간의 빠른 데이터 공유 가능
-
체크포인트 (Checkpointing): 대규모 AI 학습을 위한 고성능 병렬 체크포인트 지원
-
AI 추론을 위한 KVCache: DRAM 기반 캐싱보다 비용 효율적인 대안을 제공하며, 높은 처리량을 유지하면서도 대규모 캐시 용량 확보 가능
3FS 성능 벤치마크
3FS는 대규모 클러스터에서도 뛰어난 성능을 보입니다:
- 최대 처리량:180개의 스토리지 노드와 500개의 클라이언트 노드 구성에서 6.6TiB/s의 읽기 처리량 달성
- GraySort 벤치마크: 25개 스토리지 노드, 50개 컴퓨팅 노드에서 3.66TiB/분의 처리량 기록
- KVCache 성능: AI 추론 시 최대 40GiB/s의 읽기 처리량 달성
라이선스
3FS 프로젝트는 MIT License로 배포됩니다.
3FS GitHub 저장소
더 읽어보기
-
DeepSeek의 OpenInfra 소개 저장소: GitHub - deepseek-ai/open-infra-index: Production-tested AI infrastructure tools for efficient AGI development and community-driven innovation
-
Day 1. FlashMLA: FlashMLA: Hopper GPU를 위한 고성능 MLA 디코딩 커널 (feat. DeepSeek)
-
Day 2. DeepEP: DeepEP: 효율적인 Mixture-of-Experts 병렬 통신 라이브러리 (feat. DeepSeek)
-
Day 3. DeepGEMM: DeepGEMM: NVIDIA Hopper GPU에서 효율적인 FP8 연산을 위한 GEMM 커널 라이브러리 (feat. DeepSeek)
-
Day 4-1. EPLB: EPLB: MoE 모델에서 GPU들 간의 부하를 분배(Load Balancing)하는 라이브러리 (feat. DeepSeek)
-
Day 4-2. DualPipe: DualPipe: 양방향 파이프라인 병렬화 알고리즘 (feat. DeepSeek)
-
Day 4-3. 프로파일링 데이터: DeepSeek-V3/R1 모델 학습 및 추론 시 수집한 프로파일링 데이터 공개 (feat. DeepSeek)
-
Day 5. 3FS(Fire-Flyer File System): 3FS(Fire-Flyer File System), 고성능 분산 파일 시스템 (feat. DeepSeek)
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~