[TLDR] 오늘의 AI 뉴스, 2023-08-22: 스냅, 드림즈 출시 💭, ChatGPT의 편향성 ⚖️, 알파제로의 창의적 체스 ♟️

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :star_struck:

더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:

TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

StableVideo: 디퓨전 메서드를 사용한 동영상 편집 / StableVideo: Edit Videos Using Diffusion Methods (GitHub Repo)

디퓨전 메서드는 이미지와 비디오를 만드는 데는 좋지만, 시간이 지남에 따라 사물의 모양을 변경하지 않고 비디오를 편집하는 데는 어려움이 있습니다. StableVideo는 특별한 기술을 사용하여 편집한 개체가 동영상 전체에서 일관되게 보이도록 합니다.

While diffusion methods are great for creating images and videos, they have a hard time editing videos without changing how objects look over time. StableVideo uses a special technique to make sure edited objects look consistent throughout a video.

AI의 초기 시대 / Early Days Of AI (5 minute read)

LLM, 트랜스포머, 디퓨젼 모델의 현재 시대는 이전의 AI 시대와는 완전히 다릅니다.

This current era of LLMs, Transformers, and diffusion models is completely different from any prior AI period.

Snap, 새로운 생성형 AI 기능인 Dreams 출시 / Snap Is Launching A New Generative AI Feature, Dreams (1 minute read)

Snap은 셀카와 AI를 사용하여 환상적인 장소와 시나리오에 내 사진을 배치할 수 있는 기능인 Dreams를 출시합니다.

Snap is launching Dreams, a way to place pictures of you in fantastical places and scenarios using selfies and AI.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

OpenPipe (GitHub Repo)

OpenPipe는 LLM 프롬프트를 비교하고 최적화하기 위한 유연한 놀이터입니다. 후보 프롬프트를 빠르게 생성, 테스트, 비교할 수 있으며 모델 간에 프롬프트를 자동으로 변환할 수 있습니다.

OpenPipe is a flexible playground for comparing and optimizing LLM prompts. It lets you quickly generate, test, and compare candidate prompts, and can automatically translate those prompts between models.

candle: Rust 기반 경량 ML 프레임워크 / Minimal ML framework in Rust (GitHub Repo)

HuggingFace는 번개처럼 빠르고 여러 강력한 모델을 지원하는 깔끔한 미니멀 ML 프레임워크를 Rust로 출시했습니다.

HuggingFace released a neat little ML framework in Rust that is lightning fast and supports a number of powerful models.

RLIPv2 소개: 더 나은 언어-비전 모델 / Introducing RLIPv2: A Better Language-Vision Model (GitHub Repo)

RLIPv1은 컴퓨터가 이미지에서 보는 것을 설명하는 단어와 연결하는 데 도움이 되는 방법이지만, 속도가 느리고 데이터가 부족하다는 몇 가지 문제가 있습니다. 이 새로운 논문에서는 이미지와 단어를 더 잘 병합하기 위해 새로운 도구(ALIF)를 사용하는 더 빠른 버전인 RLIPv2를 소개합니다. 또한 이미지에서 더 많은 설명 데이터를 얻을 수 있는 새로운 방법도 있습니다.

RLIPv1 is a method that helps computers connect what they see in images to descriptive words, but it has some problems, especially with being slow and lacking data. This new paper introduces RLIPv2, a faster version that uses a new tool (ALIF) to better merge images and words. It also has a new way to get more descriptive data from images.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

ChatHaruhi: 챗봇의 롤플레잉 능력 향상 연구 / Enhancing Chatbots' Role-playing Abilities (18 minute read)

가상의 캐릭터처럼 행동하는 챗봇이 인기를 얻고 있지만, 현재 방식은 더 나은 모방을 위해 개선이 필요합니다. 이 연구는 개선된 프롬프트와 스크립트의 캐릭터 기억을 사용하는 새로운 알고리즘을 제시합니다.

Chatbots that act like fictional characters are gaining popularity, but current methods need refining for better imitation. This study presents a new algorithm using improved prompts and character memories from scripts.

Diversifying-AI: 알파제로의 창의적인 체스를 향하여 / Towards creative chess with AlphaZero (31 minute read)

딥마인드의 또 다른 멋진 게임 논문입니다. 연구원들은 환각을 줄이고 폭넓은 창의력을 향상시키기 위해 체스 플레이 에이전트인 AlphaZero를 개선하려고 합니다. 연구진은 알파제로가 플레이하는 움직임의 유형이 더 다양해지고 정말 어려운 위치 퍼즐을 풀 수 있다는 것을 발견했습니다. 장기적으로 어떻게 작동하는지 지켜보는 것도 흥미롭습니다.

Another cool games paper from Deepmind. The researchers try to improve their AlphaZero chess playing agent to reduce hallucination and improve broad creativity. They find that the types of moves it plays are more diverse and can solve really challenging positional puzzles. Interesting to see how it works out long term.

:gift: 그 외 소식 / Miscellaneous

RNN을 활용한 2D 게임 타일 생성 / Using an RNN for 2D game tile synthesis (12 minute read)

고전적인 AI 기법을 사용하여 게임 에셋을 만드는 방법에 대한 재미있는 블로그입니다. 데이터 세트 큐레이션, 하이퍼파라미터 최적화, 인간 기반 평가에 관한 좋은 정보가 많이 있습니다. 이를 SDXL 픽셀 LoRA로 확장하여 처음부터 맵을 합성할 수 있다면 정말 멋질 것 같습니다.

A fun blog about creating game assets using a classic AI technique. There are lots of good tidbits here around dataset curation, hyperparameter optimization, and human based evaluation. Could be cool to expand this with SDXL pixel LoRAs and truly synthesize maps from scratch.

더 똑똑해진 Stable Diffusion XL / I Made Stable Diffusion XL Smarter (11 minute read)

이 문서에서는 Max Woolf가 잘못된 AI 생성 이미지로 학습하여 최신 버전의 Stable Diffusion을 개선한 방법을 자세히 설명합니다.

In this article, Max Woolf breaks down how he made the newest version of Stable Diffusion better by training it on bad AI-generated images.

:point_right: :fire: :kr: [GN] AI가 잘못 생성한 이미지로 Stable Diffusion XL을 더 똑똑하게 파인튜닝했어요
sdxl stablediffusion

페티쉬 연구는 AI에 대해 무엇을 알려줄 수 있을까요? / What Can Fetish Research Tell Us About AI? (9 minute read)

인간의 페티쉬 형성과 AI 정렬 문제 사이에는 유사점이 있으며, 진화적 단서에 대한 잘못된 해석이 어떻게 페티쉬로 이어지는지 이해하면 AI 일반화 문제에 대한 통찰력을 얻을 수 있음을 시사합니다. 이 글에서는 생물학적 진화와 AI 프로그래밍의 차이점을 인정하면서 이러한 비유가 AI 학습과 해석 가능성에 영향을 미칠 수 있는 잠재력을 탐구합니다.

There are parallels between human fetish formation and AI alignment challenges, suggesting that understanding how misinterpretations of evolutionary cues lead to fetishes might offer insights into AI generalization problems. The article explores the potential for this analogy to inform AI training and interpretability, acknowledging the differences between biological evolution and AI programming.

:zap: 더 읽어보기 / Quick Links

IBM, '근로자의 40%가 재교육을 받아야 할 것' / 40% Of Workers Will Have To Reskill, According To IBM (5 minute read)

IBM의 새로운 설문 조사에 따르면 향후 3년 동안 AI 및 자동화를 구현한 결과 인력의 40%가 재교육을 받아야 할 것이라고 합니다.

According to a new survey from IBM, 40% of the workforce will have to reskill as a result of implementing AI and automation over the next three years.

Clay (Product)

클레이는 AI를 사용하여 영업 잠재 고객 발굴을 자동화합니다.

Clay uses AI to automate your sales prospecting.

FlexFlow: LLM 배포 프레임워크 / Flex flow LLM deployment framework (GitHub Repo)

프로덕션 시스템에 언어 모델을 배포할 수 있는 강력한 소프트웨어.

Powerful software to enable deployment of language models in production systems.