[GN] Prompt Injection이란 무엇인가요?

9bow · 5월 17, 2023, 2:34오전

GeekNews의 xguru 님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다.

소개

Simon Willison이 발표한 영상과 슬라이드 및 대본을 공개
Prompt Injection = "AI 모델을 기반으로 구축된 어플리케이션에 대한 공격" "AI모델에 대한 공격이 아님"
번역 인젝션 예제 및 Edge Sidebar에서 실행되는 Bing을 공격하는 페이지 등에 대한 데모
내 AI 비서가 남의 명령을 듣게 된다면? (예로 암호 재설정 메일을 어딘가로 포워딩 하라는 프롬프트를 설명)
이에 대한 솔루션들로 Prompt begging 같은게 있지만 잘 안됨
나의 제안은.. 아주 좋지는 않지만 Dual Language Model 패턴으로 약간은 해결이 가능할 듯
- AI 비서를 2개의 서로 다른 LLM 으로 구성하는 것 : Privileged LLM 과 Quarantined LLM
- Privileged LLM
  - 도구에 접근 가능
  - 신뢰할수 있는 입력만 처리
  - Quarantined LLM 에게 지시하지만, 그 입력이나 출력을 보지는 않음
  - 토큰들로만 처리 "Summarize text $VAR1"
  - "Display $SUMMARY2 to the User"
- Quarantined LLM
  - 신뢰할 수 없는 입력에 대해서 태스크를 처리 (요약 등의 작업)
  - 다른 어떤 것에도 접근은 불가능
  - 모든 입력과 출력은 더럽혀졌다고 가정 - Privileged LLM 으로 아무런 것도 직접 넘기지 않음
프롬프트 인젝션은 이해하지 못하면, 대응방법을 구현하기 불가능한 매우 나쁜 보안 취약점임
언어 모델 위에 구축된 모든 애플리케이션은 기본적으로 이 문제에 취약함
프롬프트 인젝션을 솔루션이 없어서, 어플리케이션을 안전하게 개발하지 못한다면 "No"라고 얘기해야 할 때도 있음
개발자로서 "그건 불가능해요" 라고 얘기하는 사람이 되는건 정말 싫지만, 이 경우에는 정말 중요하다고 생각

원문

출처 / GeekNews

[TLDR] 오늘의 AI 뉴스, 2023-05-15 읽을거리&정보공유

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. 더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으시면 파이토치 한국 사용자 모임에 방문해주세요! [TLDR-AI 뉴스 레터 모아보기] 주요 뉴스 & 신규 출시 소식 / Headlines & Launches OpenAI, ChatGPT 플러그인 출시 / OpenAI Rolling Out ChatGPT Plugins (2 minute read) OpenAI는 이번 주 프리미엄 가입자들을 대상으로 ChatGPT 플러그인 70종 이상을 출시합니다. 이를 통해 사용자들은 ChatGPT를 통해 인터넷에 접근할 수 있습니다. OpenAI is rolling out ChatGPT 70+ plugins to premium subscribers this week, allowing users to access the internet. …