[TLDR] 오늘의 AI 뉴스, 2023-10-16: Eleven Labs 더빙 🎤, AI 기반 채용 담당자 🤖, 다국어를 위한 트랜스포머 🔤

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터 의 승인을 받아 AI 소식을 DeepL로 번역 하여 전합니다. :star_struck:
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:
TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

생성형 AI가 전기차 배터리 개발에 도입되는 방법 / How Generative AI Is Creeping Into EV Battery Development (2 minute read)

신생 스타트업인 아이오닉스는 AI 도구를 사용하여 배터리용 최적의 전해질 소재를 빠르게 발견하고, 더 빠르게 충전되고 에너지 밀도가 높은 배터리를 생산하는 것을 목표로 합니다.

Aionics, a new startup, uses AI tools to accelerate the discovery of optimal electrolyte materials for batteries, aiming to produce faster-charging and more energy-dense batteries.

문허브 AI, 세계 최초의 AI 기반 채용 담당자를 공개하다 / Moonhub AI Unveils the World’s First AI-powered Recruiter (5 minute read)

문허브는 오늘 인플렉션, 앤트로픽, 유닷컴, 버카다 등 100여 개의 파트너 고객사들과 함께 인공지능 기반 리크루터를 공개적으로 출시했습니다. AI를 통해 기업은 몇 분 만에 검색을 시작하고, 우수한 인재를 3~5배 빠르게 채용하며, 채용당 100시간의 시간을 절약할 수 있습니다.

Moonhub launched its AI-powered recruiter publicly today, alongside an iconic list of 100s of partner customers like Inflection, Anthropic, You.com, Verkada, and more. Its AI helps companies start a search in minutes, hire exceptional talent 3-5x faster, and save 100s of hours per hire.

일레븐 랩스 더빙(제품 출시) / Eleven Labs Dubbing (Product Launch)

일레븐 랩스는 여러 화자를 지원하고 화자의 스타일을 유지하면서 29개 언어로 콘텐츠를 단 몇 초 만에 로컬라이즈할 수 있는 음성 번역 및 더빙 제품을 출시했습니다.

Eleven Labs released a voice translation and dubbing product that allows people to localize their content across 29 languages in seconds while supporting multiple speakers and preserving speakers’ styles.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

SudoLang (GitHub Repo)

SudoLang은 ChatGPT, Bing Chat, Anthropic Claude, Google Bard 등의 AI 언어 모델과 협업할 수 있도록 설계된 프로그래밍 언어입니다.

SudoLang is a programming language designed to collaborate with AI language models including ChatGPT, Bing Chat, Anthropic Claude, and Google Bard.

STGM: 그래프 믹스포머로 트래픽 예측 개선하기 / Improving Traffic Predictions with Graph Mixformer (GitHub Repo)

연구원들은 트래픽 패턴을 예측하기 위한 새로운 모델인 시공간 그래프 믹스포머(STGM) 네트워크를 개발했습니다.

Researchers have developed the Spatio-Temporal Graph Mixformer (STGM) network, a new model for predicting traffic patterns.

PonderV2: 더욱 강력한 3D 모델 구축 / Building a More Powerful 3D Model (22 minute read)

연구원들은 3D 모델을 더욱 효율적이고 다양하게 훈련할 수 있는 새로운 방법을 도입했습니다. 3D와 2D 정보를 혼합하는 독특한 접근 방식을 사용하여 사실적인 이미지 생성부터 3D 물체 인식에 이르기까지 다양한 작업에서 상당한 개선이 이루어졌습니다.

Researchers have introduced a new way to train 3D models, making them more efficient and versatile. Using a unique approach that blends 3D and 2D information, it shows significant improvements in tasks ranging from creating realistic images to recognizing 3D objects.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

8배 빠른 추론 속도를 위한 플래시 디코딩 / Flash Decoding for 8x inference speed up (12 minute read)

플래시 어텐션은 대규모 언어 모델의 학습 속도를 획기적으로 높여줍니다. 그러나 추론을 실행할 때 배치 크기는 일반적으로 1입니다. 즉, 플래시 어텐션은 거의 이점을 제공하지 않습니다. 플래시 디코딩은 같은 그룹에서 개발했으며 토큰 생성에 최적화를 제공합니다.

Flash Attention dramatically speeds up the training of large language models. However, when running inference, the batch size is usually 1. This means Flash Attention provides little benefit. Flash Decoding was developed by the same group and brings optimizations to token generation.

다국어 작업에서의 트랜스포머 / Using Transformers for Multiple Language Tasks (13 minute read)

연구원들은 자연어와 프로그래밍 언어 모두를 위한 범용 임베딩을 생성하기 위해 사전 학습된 트랜스포머 디코더의 잠재력을 탐구합니다. 이 모델은 영어 데이터에 대한 최소한의 훈련만으로 분류부터 코드 검색까지 다양한 작업에서 탁월한 성능을 발휘합니다.

Researchers explore the potential of pre-trained transformer decoders to create universal embeddings for both natural and programming languages. With minimal training on English data, these models excel in various tasks, from classification to code search.

ECMVAE: 시청각 세분화를 위한 새로운 접근 방식 / A New Approach for Audio-Visual Segmentation (16 minute read)

이 백서에서는 동영상에서 음원을 더 잘 식별할 수 있는 명시적 조건부 멀티모달 가변 자동 인코더(ECMVAE)를 소개합니다.

This paper introduces the Explicit Conditional Multimodal Variational Auto-Encoder (ECMVAE) for better identification of sound sources in videos.

:gift: 그 외 소식 / Miscellaneous

AI 리서치 채용 시장 쓰레기 쇼 / The AI Research Job Market Crap Show (7 minute read)

AI 연구 일자리는 많지만 원하는 일자리를 찾는 것은 그 어느 때보다 어렵습니다.

There are plenty of AI research jobs, but finding the job you want is as difficult as ever.

초보자를 위한 LLM / LLMs For Dummies (12 minute read)

요즘 LLM이 대세라고 하지만 실제로 어떻게 작동하는지 알고 계신가요? 이 글에서는 LLM의 기본 구조에 대한 개괄적인 개요를 살펴본 다음, 스타트업 생태계에서 등장할 수 있는 LLM 애플리케이션을 위한 네 가지 프레임워크에 대해 살펴봅니다.

LLMs are all the rage these days, but do you really know how they work? This article provides a high-level overview of the plumbing behind LLMs and then looks at four frameworks for LLM applications that might emerge in the startup ecosystem.

OpenAI의 매출 상승 / OpenAI’s Financial Ascent (1 minute read)

OpenAI의 연간 매출은 현재 13억 달러로 2022년의 2800만 달러를 크게 웃돌고 있습니다.

OpenAI’s annual revenue rate now stands at $1.3B, a far cry from 2022’s $28M.

:zap: 더 읽어보기 / Quick Links

Y Combinator 지원서 최적화 / YC Application Optimizer (Product)

펀딩에 성공한 지원서들로 학습한 인공지능으로 YC 기회를 높이세요.

Boost your YC chances with an AI trained on funded applications.

AI 안전 가드레일을 쉽게 차단하는 방법 / AI Safety Guardrails Are Easily Thwarted (2 minute read)

연구원들은 GPT-3.5 터보와 같은 대규모 언어 모델에서 심각한 취약점을 발견하여 유해 콘텐츠에 대한 안전 '가드레일'을 약간의 미세 조정을 통해 우회할 수 있음을 보여주었습니다.

Researchers have exposed significant vulnerabilities in large language models like GPT-3.5 Turbo, demonstrating that their safety "guardrails" against harmful content can be bypassed with modest fine-tuning.

Character.ai가 소개하는 그룹 채팅 / Character.ai Introduces Group Chats (1 minute read)

Character.AI는 이제 사용자와 친구들이 한 번에 여러 AI 캐릭터와 채팅할 수 있는 그룹 채팅 환경을 제공합니다.

Character.AI is now offering a group chat experience where users and their friends can chat with multiple AI characters at once.