데모 프로젝트 소개
OpenAI가 공개한 Realtime API Agents 저장소는 다중 에이전트 기반 음성 앱을 신속히 프로토타입할 수 있는 도구를 제공하는 데모용 저장소입니다. 이 저장소의 데모 코드를 사용하여 음성 상호작용, 에이전트 간 핸드오프, 상태 기반 워크플로우 구현 등 최첨단 기술을 손쉽게 탐구할 수 있게 해줍니다. 이 데모 프로젝트는 다음과 같은 기능을 포함합니다:
-
에이전트 간 순차적 핸드오프 구현
-
복잡한 결정을 위한 백그라운드 모델 호출 (예: o1-mini)
-
사용자 입력을 문자 단위로 확인하는 상태 기반 워크플로우
이 데모 앱은 Next.js와 TypeScript를 사용하며, 간단한 설치 과정을 거쳐 로컬 환경에서 빠르게 실행할 수 있습니다. 또한, 다중 에이전트 구성을 위한 템플릿과 예제가 포함되어 있어 사용자 정의 개발도 가능합니다.
에이전트 예시
GitHub 저장소의 src/app/agentConfigs
디렉토리에 각 에이전트를 정의할 수 있습니다. 예를 들어, `src/app/agentConfigs/simpleExample.ts의 간단한 에이전트 구성 예시는 다음과 같습니다:
import { AgentConfig } from "@/app/types";
import { injectTransferTools } from "./utils";
const haiku: AgentConfig = {
name: "haiku",
publicDescription: "Agent that writes haikus.",
instructions: "Ask the user for a topic, then reply with a haiku about that topic.",
tools: [],
};
const greeter: AgentConfig = {
name: "greeter",
publicDescription: "Agent that greets the user.",
instructions: "Please greet the user and ask them if they'd like a Haiku. If yes, transfer them to the 'haiku' agent.",
tools: [],
downstreamAgents: [haiku],
};
const agents = injectTransferTools([greeter, haiku]);
export default agents;
위 코드는 haiku 에이전트와 greeter 에이전트를 정의하며, greeter 에이전트가 사용자를 haiku 에이전트로 전환하는 구조를 보여줍니다.
이 외 고급 에이전트 정의 및 사용 예시는 GitHub 저장소를 참고해주세요.
라이선스
이 데모 프로젝트는 MIT License로 공개되어 있으며, 상업적 사용에 제한이 없습니다.
OpenAI의 실시간 에이전트 데모 GitHub 저장소
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~