[TLDR] 오늘의 AI 뉴스, 2023-07-17: OpenAI & AP 거래 🤝, 메타의 텍스트-이미지-텍스트 모델 🔁, 텍스트-이미지 창작물에 애니메이션 적용 🖼️

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :star_struck:

더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:

TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

AP, OpenAI와 뉴스 공유 계약 체결 / AP strikes news sharing deal with OpenAI (4 minute read)

OpenAI와 뉴스 그룹 AP가 뉴스 품질 향상을 위한 기술 공유 계약에 합의했습니다.

OpenAI and the news group AP agree on a technology sharing deal to help improve news quality.

CM3leon: 메타의 새로운 텍스트-이미지-텍스트 변환 모델 / Meta’s new text-to-image-to-text model (7 minute read)

트랜스포머의 디코더만 사용한 모델(예: GPT 시리즈)은 한 번에 하나의 토큰을 예측하여 작동합니다. 인터리브된 텍스트와 이미지를 토큰으로 취급하면 텍스트에서 이미지를, 이미지에서 텍스트를 생성할 수 있습니다. 이 모델은 손도 생성할 수 있습니다.

Decoder only Transformers (like the GPT series) operate by predicting one token at a time. If you treat interleaved text and images as tokens, you can generate images from text and text from images. This model can also generate hands.

LangChain의 문제점 / The problem with LangChain (6 minute read)

LangChain은 매우 인기 있는 체인 및 프롬프트 템플릿 라이브러리입니다. 특히 다른 분야의 기술자들이 이 분야에 뛰어들면서 강력한 커뮤니티를 형성하고 있습니다. 하지만 모든 사람에게 적합한 것은 아닙니다. 이 글에서는 몇 가지 날카로운 부분을 살펴봅니다.

LangChain is an extremely popular chaining and prompt templating library. It has gathered a strong community, especially with technologists coming into the field from other disciplines. However, it isn’t for everyone. This post explores some of the sharp edges.

(:point_right: :pytorch: :kr: [GN⁺] LangChain의 문제점)

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

Semantic Kernel (GitHub Repo)

Microsoft는 언어 모델을 위한 Python 및 C# 체인 라이브러리를 개발했습니다.

Microsoft has developed a Python and C# chaining library for language models.

FastEdit (GitHub Repo)

FastEdit는 개발자가 하나의 명령어를 사용하여 대규모 언어 모델에 새로운 맞춤형 지식을 효율적으로 주입할 수 있도록 지원하는 것을 목표로 합니다.

FastEdit aims to assist developers with injecting fresh and customized knowledge into large language models efficiently using one single command.

클로드-비공식-API / Claude-Unofficial-API (GitHub Repo)

Claude AI 챗봇의 비공식 내부 API와 상호 작용하기 위한 경량 자바스크립트 라이브러리입니다.

A lightweight JavaScript library for interacting with the Claude AI chatbot's unofficial internal API.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

긴 단계를 통해 더 빠른 수렴을 증명 / Provably faster convergence via long steps (23 minute read)

최적화 방법의 수렴 속도는 모델이 해당 최적화 방법에 따라 안내를 받을 때 얼마나 빨리 최적의 솔루션을 찾아낼 수 있는지에 대한 수학적 한계입니다. 주기적 학습 속도는 때때로 큰 폭으로 향상될 수 있다는 것이 밝혀졌습니다. 매우 매력적인 연구입니다.

The rate of convergence for optimization methods is the mathematical limit for how quickly a model can figure out the best solution when guided by that optimization method. It turns out that cyclical learning rates can be improved with an occasionally huge step. Very compelling work.

AnimateDiff: 사용자 지정 텍스트-이미지 생성물에 애니메이션 적용 / Animate Your Custom Text-to-Image Creations (4 minute read)

이 보고서에서는 Stable Diffusion, DreamBooth, LoRA와 같은 맞춤형 텍스트-이미지 모델을 사용하여 생성한 이미지에 실제와 같은 움직임을 추가할 수 있는 새로운 시스템을 소개합니다. 이 시스템은 실제 동영상에서 학습하는 '모션 모듈'을 사용하여 모든 텍스트-이미지 모델에 추가하여 정적 이미지에서 개인화되고 다양한 애니메이션을 생성할 수 있으므로 창작물을 더욱 생생하고 재미있게 만들 수 있습니다!

This report introduces a new system that can add life-like motion to any image you create using personalized text-to-image models like Stable Diffusion, DreamBooth, and LoRA. The system uses a 'motion module' which learns from real-life videos and can be added to any text-to-image model to produce personalized, diverse animations from static images, making your creations more lifelike and fun!

변화하는 환경을 이해하고 움직이는 새로운 방법 / A New Way to Understand and Move in Changing Environments (14 minute read)

이 연구에서는 내시경과 같은 애플리케이션에서 문제가 되는 끊임없이 변화하는 환경에서 카메라 움직임 추정을 개선하기 위한 Drunkard의 데이터 세트와 오도메트리를 소개합니다.

This study introduces the Drunkard's Dataset and Odometry, aimed at improving camera motion estimation in constantly changing environments, a problem in applications like endoscopies.

:gift: 그 외 소식 / Miscellaneous

AI를 사용하여 일을 하는 방법 / How To Use AI To Do Stuff (10 minute read)

올바른 작업을 수행하기 위해 올바른 AI 도구를 선택하는 방법에 대한 가이드입니다.

A guide on how to pick the right AI tool to do the right thing.

AI가 만드는 기회: 풍부한 인텔리전스 창출 / Opportunities in AI: Creating Abundant Intelligence (11 minute read)

현직자들은 AI 세대가 창출하는 분명한 새로운 기회를 잡을 것입니다. 그렇다면 분명하지 않은 기회는 무엇일까요? BCV의 이 기사는 스타트업이 우위를 점할 수 있는 분야를 살펴보고 창업자가 구축할 수 있는 아이디어나 트렌드를 제안합니다.

Incumbents will take the obvious new opportunities created by Gen AI — so, what's non-obvious? This article from BCV explores areas where startups hold the advantage and suggests ideas or trends where founders may want to build.

AI 감지기가 미국 헌법이 AI에 의해 작성되었다고 생각하는 이유 / Why AI Detectors Think The US Constitution Was Written By AI (8 minute read)

미국 헌법의 언어는 학습 데이터셋에 너무 깊숙이 뿌리내려 있어 AI가 생성한 것으로 분류됩니다. AI 글쓰기 감지기는 사람이 작성한 텍스트 데이터셋을 학습하기 때문에 신뢰할 수 없습니다. 이로 인해 오탐지가 발생할 수 있으며, 이는 부정행위 혐의를 받는 학생과 다른 사람들에게 심각한 결과를 초래할 수 있습니다.

The language of the US Constitution is so ingrained in training datasets that it is classified as AI-generated. AI writing detectors are not reliable because they are trained on a dataset of human-written text. This can lead to false positives, which can have serious consequences for students and others who are accused of cheating.

:zap: 더 읽어보기 / Quick Links

양자화 모델의 복잡성 비교 / Comparing perplexities of quantized models (8 minute read)

동일한 모델을 구현한 여러 가지 다른 구현의 성능을 살펴보는 짧은 게시물입니다.

A quick post that explores the performance of several different implementations of the same models.

Parse.dev (Product)

Parse는 AI 기반 데이터 분석기입니다.

Parse is your AI powered data analyst.

Elon, 최고의 AI 인재에게 9자리 숫자(수억 달러)를 약속 / Elon Threw 9 Figure Promises At Top AI Talent (3 minute read)

Elon Musk는 이미 수백억 달러의 가치가 있다고 주장한 벤처의 지분을 가지고 새로운 인공지능 회사에 최고의 인공지능 인재를 영입하려고 했습니다.

Elon Musk sought to recruit top AI talent to his new artificial intelligence company with equity in the venture he claimed was already worth tens of billions of dollars.

Petals and Peft (Google Colab)

Petals는 리소스가 제한된 시스템에서 매우 큰 모델을 서비스하고 미세 조정하기 위해 개발된 프레임워크입니다. 이 노트북은 시스템 사용 방법에 대한 읽기 쉬운 코드 스니펫을 제공합니다.

Petals is a framework developed to serve and fine-tune really large models on resource constrained systems. This notebook gives some really readable code snippets on how to use the system.