Claude 3.5 Sonnect 및 Haiku 출시 소개
Anthropic은 업그레이드된 Claude 3.5 Sonnet 모델과 새로운 Claude 3.5 Haiku 모델을 발표했습니다. Claude 3.5 Sonnet은 전반적인 성능이 향상되었으며, 특히 코딩 능력이 두드러집니다. 새롭게 도입된 Claude 3.5 Haiku는 이전 Claude 3 모델과 유사한 속도와 비용으로, 동일한 성능을 제공합니다. 또한, 컴퓨터 사용 기능이 공개 베타로 출시되었으며, 개발자들은 이를 통해 Claude가 인간처럼 화면을 보고, 마우스와 키보드를 사용하여 컴퓨터를 조작하도록 지시할 수 있습니다.
Claude 3.5 Sonnet: 업계 선도적 소프트웨어 엔지니어링 기술
Claude 3.5 Sonnet은 기존 모델보다 훨씬 더 뛰어난 성능을 자랑하며, 특히 에이전틱(Agentic) 코딩 및 도구 사용 작업에서 큰 향상을 보였습니다. 코딩 벤치마크인 SWE-bench Verified에서는 33.4%에서 49.0%로 성능이 향상되었고, TAU-bench의 도구 사용 작업에서도 다양한 도메인에서 개선된 결과를 보였습니다. GitLab과 같은 초기 고객들은 이 모델이 이전보다 10% 더 향상된 추론 능력을 제공하면서도 지연 없이 다중 단계의 소프트웨어 개발 작업을 수행할 수 있다고 보고했습니다.
Claude 3.5 Haiku: 비용 효율성과 속도의 새로운 기준
Claude 3.5 Haiku는 비용과 속도 면에서 우수하며, 이전에 가장 큰 모델이었던 Claude 3 Opus보다 더 나은 성능을 제공합니다. 특히 코딩 작업에서 강력한 성능을 보이며, SWE-bench Verified에서 40.6%의 점수를 기록해 이전 모델을 뛰어넘는 성과를 보여줍니다. 이 모델은 지연 시간이 낮고 도구 사용의 정확성이 높아 대량의 데이터를 처리하는 사용자 인터페이스 및 서브 에이전트 작업에 적합합니다.
컴퓨터 사용 기능: 컴퓨터 탐색 기술의 혁신적 도전 (Public Beta)
Claude 3.5 Sonnet은 이제 인간이 컴퓨터를 사용하는 것처럼 스크린을 보고, 커서를 이동하고, 버튼을 클릭하며, 텍스트를 입력하는 기능을 제공합니다. 이 기능은 현재 실험 단계이며, Replit과 같은 기업에서 이미 이를 사용하여 수십에서 수백 단계에 걸친 복잡한 작업을 자동화하는 데 적용하고 있습니다. Claude는 OSWorld 평가에서 스크린샷만을 기반으로 한 컴퓨터 사용 능력에서 14.9%의 점수를 기록하여, 다음으로 우수한 시스템의 점수(7.8%)보다 두 배 가까이 높은 성과를 거두었습니다.
향후 전망
이 기술은 여전히 초기 단계에 있으며, Anthropic은 앞으로 Claude의 컴퓨터 사용 능력이 급속히 발전할 것으로 예상하고 있습니다. 컴퓨터 사용 기능은 새로운 위협에 대한 가능성도 제기하며, Anthropic은 이를 해결하기 위해 안전한 배포를 위한 다양한 연구와 검증을 수행 중입니다. 이 기술의 초기 배포에서 얻은 교훈은 점점 더 강력한 AI 시스템의 잠재력과 그 의미를 이해하는 데 도움을 줄 것입니다.
출시 공지
컴퓨터 제어 API 문서
Claude 3.5 모델 개요
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~