Microsoft, Phi-3 활용을 위한 Cookbook 공개
소개
Microsoft Phi-3은 Microsoft가 개발한 소형 언어 모델(SLM, Small Language Model)군입니다. Phi-3 모델들은 같은 크기와 더 큰 크기의 모델들을 능가하는 성능을 제공하며, 언어, 추론, 코딩, 수학 벤치마크에서 뛰어난 성과를 보여줍니다. Phi-3-mini는 3.8B 파라미터를 가진 언어 모델로, Microsoft Azure AI Studio, Hugging Face, Ollama에서 사용할 수 있습니다. Phi-3 모델은 더 큰 모델보다도 우수한 성능을 보여주며, 특히 Phi-3-small과 Phi-3-medium은 GPT-3.5T와 같은 대형 모델을 능가합니다. Phi-3-vision은 시각적 추론, OCR, 표 및 차트 이해 작업에서 우수한 성능을 제공합니다. 이처럼 Phi-3 모델은 소형이지만 매우 강력한 성능을 자랑합니다.
Phi-3 모델은 같은 크기의 다른 모델들 뿐만 아니라, 더 큰 크기의 모델들과 비교했을 때도 뛰어난 성능을 보입니다. 예를 들어, Phi-3-small은 7B 파라미터로 GPT-3.5T를 능가하며, Phi-3-medium은 14B 파라미터로 Gemini 1.0 Pro를 능가합니다. 또한, Phi-3-vision은 4.2B 파라미터로 Claude-3 Haiku와 Gemini 1.0 Pro V보다 우수한 성능을 제공합니다.
주요 특징 및 성능
- Phi-3-mini: 3.8B 파라미터를 가진 언어 모델로, Microsoft Azure AI Studio, Hugging Face, Ollama에서 사용 가능.
- Phi-3-small: 7B 파라미터로, GPT-3.5T를 능가하는 성능.
- Phi-3-medium: 14B 파라미터로, Gemini 1.0 Pro를 능가하는 성능.
- Phi-3-vision: 4.2B 파라미터로, 시각적 추론, OCR, 표 및 차트 이해 작업에서 우수한 성능.
사용법
Azure AI Studio
Microsoft Phi-3을 사용하여 다양한 하드웨어 장치에서 E2E 솔루션을 구축하는 방법을 배울 수 있습니다. 모델을 사용해보고 시나리오에 맞게 Phi-3을 커스터마이징하는 작업은 Azure AI Studio, Azure AI Model Catalog에서 시작할 수 있습니다.
- Playground: 각 모델은 전용 테스트 공간을 제공하며, Azure AI Playground에서 테스트할 수 있습니다.
Hugging Face
Hugging Face에서도 모델을 사용할 수 있으며, Hugging Chat playground에서 모델을 테스트할 수 있습니다.
목차
- 소개(Introduction)
- 빠른 시작(Quick Start)
- Phi-3 추론(Inference Phi-3)
- Phi-3 미세 조정(Fine-tuning Phi-3)
- Phi-3 평가(Evaluation Phi-3)
라이선스
이 프로젝트는 MIT License로 공개 및 배포되고 있습니다.
Phi-3 Cookbook 저장소
더 읽어보기
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~