OpenAI, 복잡한 현실의 업무를 처리할 수 있는 ChatGPT Agent 출시 (ChatGPT + DeepResearch + Operator)

9bow · 7월 18, 2025, 2:30오전

ChatGPT Agent 소개

OpenAI는 2025년 7월, 인공지능이 실제 업무를 ‘직접 수행’할 수 있는 단계로 도약하는 ChatGPT Agent를 공식 발표했습니다. 지금까지 ChatGPT는 사용자의 질문에 답하거나 정보를 요약해주는 도우미 역할에 머물렀지만, 이번 에이전트 기능은 단순한 대화형 AI를 넘어 직접 행동하는 능동적 시스템으로 진화한 것입니다. 예를 들어 “회의 일정을 정리해줘”, “일본식 아침 식사를 위한 재료를 계획하고 주문해줘”, “경쟁사 분석 후 PPT 만들어줘”와 같은 요청을 하면, ChatGPT가 알아서 웹사이트를 탐색하고 로그인 절차를 유도하며 데이터를 수집하고 보고서, 프레젠테이션, 스프레드시트를 생성합니다.

이러한 기능은 OpenAI의 두 실험적 기능이었던 Operator와 Deep Research의 장점을 통합해 탄생했습니다. Operator는 웹을 클릭하고 스크롤하며 상호작용하는 능력을, Deep Research는 심층 분석과 요약 능력을 갖추고 있었지만 각각의 한계로 인해 복합적인 작업을 수행하기에는 부족함이 있었습니다. 새로운 ChatGPT Agent는 이 둘을 통합하고, 여기에 ChatGPT의 고도화된 추론과 대화 능력까지 결합하여 **진정한 ‘에이전트형 AI’**로 재정립된 것입니다.

ChatGPT Agent는 시각 브라우저, 텍스트 브라우저, API 호출, 터미널 인터페이스를 포함한 가상의 컴퓨터 환경에서 작동합니다. 또한 Gmail, Google Calendar, Github 등의 앱과 연결(Connectors)할 수 있어, 실제 업무 플로우에 깊숙이 통합됩니다. 무엇보다 중요한 점은 사용자가 언제든지 작업을 중단하거나 개입할 수 있으며, 민감한 작업(예: 결제, 이메일 발송) 전에 반드시 명시적 승인을 요구한다는 점입니다. 이는 사용자 통제를 유지하며 안전성을 보장하는 핵심적인 설계입니다.

이번 기능은 단순히 기술적 진보에 그치지 않고, 반복적이거나 시간이 많이 소요되는 작업을 자동화함으로써 지식 근로자의 생산성과 창의성을 크게 높일 수 있는 잠재력을 지니고 있습니다.

주요 기술 비교: Operator, Deep Research, 그리고 ChatGPT Agent

기능 요소	Operator	Deep Research	ChatGPT Agent
웹 브라우징	그래픽 UI 상호작용(스크롤, 클릭 등)	단순 검색 기반 정보 수집	두 방식 모두 통합
정보 요약 및 분석	제한적	고급 요약 및 인용 포함 보고서 제공	실시간 요약 및 아티팩트(PPT, Excel 등) 생성
사용자 명령 처리	순차적 실행	분석 중심	실시간 명령 전환 및 사용자 개입 가능
파일 생성 능력	없음	텍스트 보고서 중심	PPT, Excel, PDF 등 생성 가능
안전성 제어	일부 확인 단계	일부 승인 절차	고위험 작업 전 승인 필수, Watch Mode, 개인정보 제한 등

에이전트의 통합 아키텍처

ChatGPT Agent는 단일한 모델로 다양한 도구를 제어하는 가상 컴퓨터 환경(Virtual Machine) 위에서 작동합니다. 이 환경에는 다음과 같은 도구가 포함됩니다:

시각 브라우저: 실제 사용자가 보는 것과 동일한 방식으로 웹 페이지를 클릭하고 조작
텍스트 기반 브라우저: 효율적 텍스트 분석에 최적화된 방식으로 웹 탐색
터미널: 코드 실행 및 파일 처리
API 호출: Gmail, Google Calendar, Github 등과 연동된 정보를 자동으로 가져오고 처리

이러한 도구들을 조합하여, ChatGPT는 한 번의 명령으로 다단계 작업을 수행할 수 있습니다. 예를 들어, 사용자의 Gmail에서 메일 요약 → 링크된 문서를 수집 → 코드 실행을 통한 분석 → 결과를 PPT로 작성 → Google Drive에 저장까지 모두 자동으로 수행이 가능합니다.

작업 도중 언제든지 사용자가 개입하거나 작업을 변경할 수 있으며, 중간 결과를 요청하거나 전체 작업을 정지하고 부분 결과만 수령하는 것도 가능합니다.

실사용 사례 및 활용 시나리오

업무 자동화

회의 일정 분석 및 브리핑: 캘린더와 뉴스를 결합하여 회의 전 요약 문서 제공
데이터 대시보드 → PPT 전환: 스크린샷 기반 대시보드를 벡터 기반 슬라이드로 자동 구성
재무 데이터 입력 및 보고서 작성: 스프레드시트의 기존 포맷을 유지하며 새로운 데이터 삽입

일상 생활

식사 준비: 일본식 아침 식사 계획, 재료 구매, 온라인 주문까지
여행 예약 및 일자 조정: 항공권 예약, 호텔 비교, 동반자 스케줄 확인
전문가 탐색 및 상담 예약: 조건 기반 전문의 탐색 후 시간대 확인 및 예약

벤치마크 결과 및 성능

Humanity’s Last Exam (HLE): 다양한 분야의 고급 지식을 다루는 시험에서 SOTA 기록(41.6% → 병렬 전략 후 44.4%)
FrontierMath: 난이도 높은 수학 문제 풀이 정확도 27.4%
DSBench: 현실적인 데이터 과학 문제 해결에서 인간보다 높은 성과
SpreadsheetBench: 스프레드시트 자동 편집에서 Copilot Excel(20%) 대비 2배 이상 성능 (최대 45.5%)
BrowseComp: 웹 정보 탐색 정확도에서 Deep Research보다 17.4%P 높은 68.9%
투자은행 모델링 작업 평가: 3-states 모델, LBO 모델 등에서 인간 전문가와 대등한 수준의 평가 획득

보안 및 안전 정책

프롬프트 인젝션 방지

에이전트가 웹 상에서 악성 명령을 읽고 오작동하는 것을 방지하기 위해 특별한 훈련과 모니터링을 거쳤습니다. 예: 보이지 않는 HTML 요소에 “로그아웃하라”는 명령이 숨겨져 있어도 이를 무시하거나 사용자 확인을 요구함.

사용자 승인 및 감시 모드

명시적 사용자 승인: 이메일 발송, 구매, 로그인 등 실질 행동에는 사용자 허가 필요
Watch Mode: 고위험 작업에는 사용자가 브라우저 탭에서 직접 감시해야 진행 가능
모델 거부 학습: 은행 송금 등 위험한 작업은 모델 스스로 거부

개인정보 보호 및 데이터 제어

한 번의 클릭으로 모든 브라우징 데이터 삭제 및 로그인 세션 종료 가능
브라우저 인계 모드에서는 입력값을 저장하지 않음 (비밀번호, 로그인 정보 포함)
쿠키 정책은 각 웹사이트에 따름

생물학적 위험에 대한 대비

OpenAI는 ChatGPT Agent를 생물·화학 분야의 높은 리스크 모델로 분류하고, 생물 위협 방지를 위한 최대한의 안전 장치를 적용했습니다. 여기에는 이중용도 거부 훈련, 위험 탐지 분류기, 행동 감시 로직, 외부 전문가와의 협력 등이 포함됩니다.

사용법

현재 유료 사용자(Plus, Pro, Team)에게 제공 중
ChatGPT Web/App에서 대화 도중 툴 드롭다운 메뉴에서 ‘agent mode’를 활성화
명령을 텍스트로 설명하면 작업이 시작되며, 작업 중에는 실시간 화면 안내 제공
Gmail, Github 등 커넥터 활성화 시 사용자 프롬프트 기반 정보 요약 및 연동 가능
반복 작업 예약도 가능 (예: 매주 월요일 오전 보고서 자동 생성)

제한 사항과 향후 과제

슬라이드 생성은 아직 베타 단계로 서식 오류가 존재할 수 있음
복잡한 작업은 최대 30분 소요될 수 있음
고급 기능 사용에는 Pro 사용자 기준 월 400회 제한, Plus/Team은 40회
현재는 스위스 및 EEA 일부 지역에 제공되지 않음

ChatGPT Agent 소개 블로그

https://openai.com/index/introducing-chatgpt-agent/

ChatGPT Agent 시스템 카드

https://openai.com/index/chatgpt-agent-system-card/

이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.

파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~