안드레이 카파시, 'LLM은 새로운 컴퓨팅 패러다임'

파시라고도 불리는, Andrej Karpathy의 트위터를 DeepL로 간략히 번역해보았습니다.andrej-karpathy

원문은 아래에서 보실 수 있습니다.

https://twitter.com/karpathy/status/1707437820045062561


Andrej Karpathy LLM is new OS

최근 많은 :jigsaw: (퍼즐조각들) 이 맞춰지면서 챗봇이 아닌 새로운 운영 체제의 커널 프로세스로서의 LLM에 대한 보다 완전한 그림이 등장하고 있습니다. 예를 들어, 오늘날에는 LLM이 아래와 같은 역할들을 수행합니다:

With many :jigsaw: dropping recently, a more complete picture is emerging of LLMs not as a chatbot, but the kernel process of a new Operating System. E.g. today it orchestrates:

  • 모달리티(텍스트, 오디오, 시각)에 걸친 입력 및 출력
  • Input & Output across modalities (text, audio, vision)
  • 코드 인터프리터, 프로그램 작성 및 실행 기능
  • Code interpreter, ability to write & run programs
  • 브라우저/인터넷 액세스
  • Browser / internet access
  • 파일 및 내부 메모리 저장 및 검색을 위한 임베딩 데이터베이스
  • Embeddings database for files and internal memory storage & retrieval

많은 컴퓨팅 개념이 이어집니다. 현재 우리는 싱글 스레드 실행을 ~10Hz(tok/s)로 실행하고 있으며, 어셈블리 수준의 실행 추적을 스트림별로 살펴보는 것을 즐깁니다. 컴퓨터 보안의 개념은 공격, 방어 및 새로운 취약점과 함께 계속 이어집니다.

A lot of computing concepts carry over. Currently we have single-threaded execution running at ~10Hz (tok/s) and enjoy looking at the assembly-level execution traces stream by. Concepts from computer security carry over, with attacks, defenses and emerging vulnerabilities.

저는 업계가 비슷한 형태로 형성되고 있는, "운영체제(OS)"라는 가장 유사한 비유 또한 좋아합니다:

I also like the nearest neighbor analogy of "Operating System" because the industry is starting to shape up similar:

Windows, OS X, Linux <-> GPT, PaLM, Claude, 라마/미스트랄(?:)).

Windows, OS X, and Linux <-> GPT, PaLM, Claude, and Llama/Mistral(?:)).
OS에는 기본 앱이 제공되지만 앱 스토어가 있습니다.
An OS comes with default apps but has an app store.
대부분의 앱은 여러 플랫폼에 맞게 조정할 수 있습니다.
Most apps can be adapted to multiple platforms.

요약하자면, LLM을 챗봇으로 보는 것은 초기 컴퓨터를 계산기로 보는 것과 같습니다. 우리는 완전히 새로운 컴퓨팅 패러다임의 출현을 목격하고 있으며, 이는 매우 초기 단계입니다.

TLDR looking at LLMs as chatbots is the same as looking at early computers as calculators. We're seeing an emergence of a whole new computing paradigm, and it is very early.