Devstral 소개
프랑스의 AI 스타트업 Mistral AI가 All Hands AI와 협력하여 새로운 오픈소스 코딩 에이전트 모델인 Devstral을 공개했습니다. 이 모델은 SWE-Bench Verified 벤치마크에서 46.8%의 점수를 기록하며 기존의 오픈소스 모델들을 능가하는 성능을 보여주고 있습니다. 또한, RTX 4090 GPU나 32GB RAM을 가진 Mac에서도 실행 가능하여 로컬 환경에서도 활용할 수 있습니다.
Mistral AI는 2025년 5월 21일, 소프트웨어 엔지니어링 작업을 위한 에이전트형 LLM인 Devstral을 발표했습니다. 이 모델은 All Hands AI와의 협력을 통해 개발되었으며, 실제 GitHub 이슈를 해결하도록 훈련되었습니다. Devstral은 코드베이스 탐색, 다중 파일 편집, 복잡한 함수 내의 미묘한 버그 식별 등 실제 소프트웨어 개발 작업에 필요한 능력을 갖추고 있습니다. 또한, OpenHands나 SWE-Agent와 같은 코드 에이전트 스캐폴드를 통해 실행되며, SWE-Bench Verified 벤치마크에서 46.8%의 점수를 기록하여 기존 오픈소스 모델들을 능가하는 성능을 보여주고 있습니다.
Devstral은 기존의 오픈소스 모델인 Deepseek-V3-0324(671B)와 Qwen3 232B-A22B보다 우수한 성능을 보여주고 있습니다. 또한, GPT-4.1-mini와 같은 폐쇄형 모델보다도 20% 이상 높은 성능을 기록하고 있습니다. 이러한 성능은 Devstral이 실제 소프트웨어 엔지니어링 작업에 적합하도록 설계되었음을 보여줍니다.
Devstral의 주요 특징
- 에이전트형 LLM: Devstral은 코드베이스 탐색, 다중 파일 편집, 복잡한 함수 내의 미묘한 버그 식별 등 실제 소프트웨어 개발 작업에 필요한 능력을 갖추고 있습니다.
- 고성능: SWE-Bench Verified 벤치마크에서 46.8%의 점수를 기록하여 기존 오픈소스 모델들을 능가하는 성능을 보여줍니다.
- 로컬 실행 가능: RTX 4090 GPU나 32GB RAM을 가진 Mac에서도 실행 가능하여 로컬 환경에서도 활용할 수 있습니다.
- 128k 토큰 컨텍스트 윈도우: 긴 코드 컨텍스트를 처리할 수 있어 대규모 코드베이스에서도 효과적으로 작동합니다.
사용 방법
Devstral은 Hugging Face, Ollama, Kaggle, Unsloth, LM Studio 등에서 다운로드하여 사용할 수 있습니다. 또한, Mistral의 API를 통해 devstral-small-2505라는 이름으로 사용할 수 있으며, 입력 토큰당 $0.1, 출력 토큰당 $0.3의 비용이 발생합니다.
Devstral 소개 블로그
Devstral 모델 다운로드
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~