3FS(Fire-Flyer File System), 고성능 분산 파일 시스템 (feat. DeepSeek)

들어가며 :pytorch::kr:

DeepSeek에서 이번 주, 하루에 하나씩, 인프라와 관련한 GitHub 저장소를 공개하기로 하였습니다. 오늘은 5번째이자 마지막 날로, 모델 학습 및 추론을 위한 고성능 분산 파일 시스템인 3FS가 공개되었습니다. :astonished:

3FS 소개

Deepseek AI가 개발 및 공개한 3FS는 Fire-Flyer File System의 약자로, 대규모 데이터 처리와 AI 모델 학습 및 추론을 위해 최적화된 고성능 분산 파일 시스템입니다. 특히, 특히 SSD와 RDMA 네트워크를 활용해 고성능/고속의 데이터 읽기/쓰기가 가능하며, 대규모 클러스터에서도 일관된 성능과 유연성을 제공합니다.

3FS 프로젝트의 목적은 데이터 로딩, 체크포인트, AI 추론 등의 작업을 더 빠르고 효율적으로 수행할 수 있도록 지원하는 것으로, 주요 특징은 다음과 같습니다:

  • 분리형(disaggregated) 아키텍처: 다수의 SSD와 스토리지 노드를 활용해 병목 없는 데이터 처리 가능

  • 강력한 일관성(Strong Consistency): Chain Replication with Apportioned Queries (CRAQ) 방식으로 데이터 정합성을 유지

  • 표준 파일 인터페이스 지원: FoundationDB 기반의 트랜잭션 키-값 저장소를 활용하여 기존 스토리지 API를 그대로 사용 가능

기존의 NFS나 오브젝트 스토리지와 비교해보면, 3FS는 AI 모델 학습 및 데이터 분석을 위해 설계된 것이 특이점입니다. 특히, RDMA 네트워크와 SSD의 조합으로 속도와 일관성을 동시에 유지할 수 있습니다:

기능 3FS 기존 NFS Object Storage (S3 등)
성능 초고속 SSD 및 RDMA 활용 네트워크 속도에 의존 대체로 낮음
일관성 강력한 일관성 (CRAQ) 보통 최종적 일관성 (Eventually Consistent)
데이터 접근 POSIX 인터페이스 제공 POSIX API 기반
대규모 처리 AI 학습 및 추론에 최적화 범용 데이터 저장 중심

3FS의 주요 기능

  • 데이터 준비: 데이터 분석 파이프라인의 출력을 계층적 디렉토리 구조로 정리하고 대량의 중간 결과를 효율적으로 관리

  • 데이터 로딩 (Dataloaders): AI 학습을 위한 데이터셋을 랜덤 액세스 방식으로 제공하여 데이터 프리페칭이 필요하지 않으며, GPU 및 CPU 노드 간의 빠른 데이터 공유 가능

  • 체크포인트 (Checkpointing): 대규모 AI 학습을 위한 고성능 병렬 체크포인트 지원

  • AI 추론을 위한 KVCache: DRAM 기반 캐싱보다 비용 효율적인 대안을 제공하며, 높은 처리량을 유지하면서도 대규모 캐시 용량 확보 가능

3FS 성능 벤치마크

3FS는 대규모 클러스터에서도 뛰어난 성능을 보입니다:

  • 최대 처리량:180개의 스토리지 노드와 500개의 클라이언트 노드 구성에서 6.6TiB/s의 읽기 처리량 달성

  • GraySort 벤치마크: 25개 스토리지 노드, 50개 컴퓨팅 노드에서 3.66TiB/분의 처리량 기록

  • KVCache 성능: AI 추론 시 최대 40GiB/s의 읽기 처리량 달성

라이선스

3FS 프로젝트는 MIT License로 배포됩니다.

:github: 3FS GitHub 저장소

더 읽어보기




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:kr:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:gift: 아래:arrow_lower_right:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck: