Hermes 3, Llama 3.1 기반의 파인튜닝 모델 (feat. Nous Research)

9bow · 8월 16, 2024, 8:55오전

Hermes 3 모델 소개

Hermes 3는 Nous Research에서 공개한 최첨단 AI 모델로, 8B, 70B, 405B 크기의 Llama 3.1 모델들을 미세조정(finetuning)하여 설계 및 개발되었습니다. 이 모델은 시스템 프롬프트에 매우 민감하게 반응하여, 제공된 지시에 따라 다양한 페르소나와 작업을 수행할 수 있습니다. 특히 128K 토큰 컨텍스트 윈도우를 활용하여 상호작용 및 롤플레잉 시나리오에서 일관된 다중 턴 대화(Multi-turn Conversation)를 유지하는 데 뛰어납니다.

Hermes 3는 잠금 해제된, 검열되지 않은, 그리고 높은 수준으로 조정 가능한 모델입니다. Nous Research에서 최근에 개발한 이 모델은 Llama 3.1 8B, 70B, 405B를 세부 조정(fine-tuning)하여 만들어졌으며, 주로 합성된 응답 데이터셋을 기반으로 학습되었습니다. 이 모델은 Llama 3.1과 비교해도 동등하거나 우수한 성능을 자랑하며, 추론과 창의성에서 더 깊은 역량을 발휘합니다.

Llama 3.1과 비교했을 때, Hermes 3는 다음과 같은 차별화된 특징을 가지고 있습니다:

장기적 컨텍스트 유지: Hermes 3는 대화의 연속성을 유지하면서 복잡한 시나리오를 처리하는 데 강점을 보입니다.
복잡한 역할 수행: 이 모델은 다중 턴 대화를 지원하며, 역할 놀이와 내부 독백 기능을 통해 더 자연스러운 대화 경험을 제공합니다.
향상된 기능 호출 능력: Hermes 3는 더욱 정교하고 유연하게 시스템과 지시문을 따르도록 설계되었습니다.

Hermes 3는 Nous Research의 Discord 서버를 통해 실시간으로 체험해볼 수 있으며, Lambda Labs의 클라우드를 통해서도 접근 가능합니다. 또한, GitHub에 공개된 Hermes 3 Function-Calling을 활용하여 다양한 기능을 테스트할 수 있습니다. Hermes 3의 기능과 성능을 최대한 활용하기 위해서는 최신 AI 툴과 프레임워크에 익숙해야 하며, Llama 3.1에 대한 이해도가 필요합니다.

Hermes 3 공개 글

Hermes 3 모델 기술 문서

Hermes 모델군 소개

Hermes 3 함수 호출(Function-Calling) 관련 저장소

https://github.com/NousResearch/Hermes-Function-Calling

Lambda Labs의 Hermes 3 소개 글

이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.

파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~