[TLDR] 오늘의 AI 뉴스, 2023-09-12: 메타의 GPT-4 경쟁자 개발 중 🥷, 프로젝트 구텐베르크, AI 오디오북 출시 📚, 자율 주행 자동차 및 언어 안내 🚗

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터 의 승인을 받아 AI 소식을 DeepL로 번역 하여 전합니다. :star_struck:
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:
TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

프로젝트 구텐베르크, 수천 개의 AI 오디오북 출시 / Project Gutenberg releases thousands of AI audiobooks (22 minute read)

Microsoft와 협력하여 수천 권의 오픈 도메인 도서를 최첨단 텍스트 음성 변환 기술로 전사했습니다. 대부분의 스트리밍 플랫폼에서 이용할 수 있습니다. 프로세스에 대한 정보는 링크에 포함되어 있습니다.

In collaboration with Microsoft, thousands of open-domain books have been transcribed with state-of-the-art text-to-speech. They're available on most streaming platforms. Information about the process is included in the link.

메타, GPT-4 경쟁자 개발 중 / Meta Is Working On A GPT-4 Competitor (1 minute read)

Meta는 OpenAI의 GPT-4만큼 정교한 새 챗봇을 만들기 위해 AI 트레이닝 칩을 구입하고 데이터 센터를 구축해 왔습니다.

Meta has been snapping up AI training chips and building out data centers in order to create a more powerful new chatbot it hopes will be as sophisticated as OpenAI’s GPT-4.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

RestGPT (GitHub Repo)

RestGPT는 영화 데이터베이스나 음악 플레이어와 같은 실제 애플리케이션을 제어할 수 있는 대규모 언어 모델 기반 자율 에이전트를 구축하는 것을 목표로 합니다.

RestGPT aims to construct a large language model-based autonomous agent to control real-world applications, such as movie databases and music players.

PointLLM: 3D 도형을 이해하도록 언어 모델 교육하기 / Teaching Language Models to Understand 3D Shapes (GitHub Repo)

PointLLM은 언어 모델이 텍스트와 2D 이미지뿐 아니라 3D 객체도 이해할 수 있도록 도와주는 도구입니다.

PointLLM is a tool that helps language models understand 3D objects, not just text and 2D images.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

Medusa: 초안 모델 없이 추측 디코딩 속도 향상 / Speed up speculative decoding without a draft model (8 minute read)

언어 모델 추론은 일반적으로 메모리 사용량이 많기 때문에 속도가 느립니다. 그래서 사람들은 더 작은 초안 모델을 사용하여 "미리 실행"하고 큰 모델에 제안을 제공하는 추측적 디코딩을 도입했습니다. 이 방법은 잘 작동하지만 구현하기가 복잡하고 좋은 초안 모델을 찾기가 어렵습니다. 대신 다양한 내부 단계에서 활성화를 분리하여 자체 초안 역할을 하는 메두사 모델을 만들 수 있습니다. 이렇게 하면 성능 저하 없이 라마의 속도를 두 배로 높일 수 있습니다.

Language model inference is generally slow because these models are heavily memory-bound. So people have introduced speculative decoding using a smaller draft model to “run ahead” and offer suggestions to the large model. This works well, but it’s complicated to implement, and finding a good draft model is tough. Instead, you can create a Medusa model that acts as its own draft by splitting off activations from various internal stages. This speeds up Llama 2x without compromising performance.

사진에 대한 더 나은 이해와 추론 / A Better Understanding and Reasoning About Pictures (22 minute read)

이 연구의 저자는 시각 언어 모델이 보이는 것에 대해 논리적으로 얼마나 잘 생각할 수 있는지 테스트하는 방법을 만들었습니다.

The authors of this study have created a way to test how well vision-language models can also think logically about what they see.

언어 안내로 더 스마트한 자율 주행 자동차 만들기 / Making Self-Driving Cars Smarter with Language Prompts (15 minute read)

이 프로젝트에서는 자율 주행 차량이 주변 사물을 더 잘 이해하고 추적할 수 있도록 일상 언어로 된 새로운 지침 세트인 NuPrompt를 소개합니다. 정말 잘 작동합니다! self-driving

This project introduces NuPrompt, a new set of instructions in everyday language that helps self-driving cars understand and track objects around them better. It works really well!

:gift: 그 외 소식 / Miscellaneous

LLM이 이성을 가질 수 있을까? / Can LLMs Reason? (10 minute read)

대규모 언어 모델을 둘러싼 논쟁은 인간과 같은 추론 능력을 가지고 있는지 아니면 암기와 패턴 매칭에 의존하는지에 관한 것으로, 연구 결과에 따라 상반된 결과를 보이고 있습니다. 학습 데이터와 관련된 작업에서 탁월한 능력을 발휘하는 경향이 있기 때문에 진정한 추상적 추론에 대해 LLM을 평가하는 것은 어려운 일이며, 이를 명확히 하기 위해서는 추가 연구가 필요합니다.

The debate surrounding large language models concerns whether they possess human-like reasoning abilities or rely on memorization and pattern-matching, with studies showing mixed results. Evaluating LLMs for true abstract reasoning is challenging due to their tendency to excel in tasks related to their training data, necessitating further research for clarification.

LLM 기반 시스템 및 제품 구축을 위한 패턴 / Patterns for Building LLM-based Systems & Products (66 minute read)

이 글에서는 대규모 언어 모델을 시스템에 통합하기 위한 7가지 실용적인 패턴, 즉 성능 측정, 최신 지식 추가, 작업 미세 조정, 시간/비용 절감을 위한 캐싱, 품질 출력 보장, 오류 관리, 사용자 피드백 활용에 대해 설명합니다. llm-in-production llm-finetuning

This article shares seven practical patterns for integrating large language models into systems: measuring performance, adding recent knowledge, fine-tuning for tasks, caching to save time/cost, ensuring quality output, managing errors, and harnessing user feedback.

(더 읽어보기 :point_right: [GN] LLM 기반의 시스템 & 제품 구축 패턴들)

또 다른 작가 그룹이 저작권 문제로 OpenAI를 고소하고 있습니다 / Another group of writers is suing OpenAI over copyright claims (2 minute read)

OpenAI는 ChatGPT를 훈련시키기 위해 저작권이 있는 저작물을 불법적으로 사용했다는 혐의로 작가들로부터 소송을 당했습니다. 이들은 자신의 콘텐츠를 요약하고 분석하는 ChatGPT의 기능이 자신의 저작물을 직접 훈련하는 것으로 저작권 침해에 해당한다고 주장합니다. 이는 다른 저작자들이 OpenAI를 상대로 제기한 유사한 소송에 이은 것입니다.

OpenAI faces a lawsuit from writers alleging illegal use of their copyrighted works to train ChatGPT. They argue that ChatGPT's capabilities to summarize and analyze their content indicate direct training on their works, constituting copyright infringement. This follows similar suits from other authors against OpenAI.

:zap: 더 읽어보기 / Quick Links

오디오노트 / AudioNotes (Product)

AI를 사용해 임의의 음성 노트와 구조화되지 않은 텍스트 노트를 구조화된 텍스트 요약으로 변환하세요.

Convert your random voice notes and unstructured text notes into structured text summaries using AI.

헬프키트 AI / HelpKit AI (Product)

헬프키트 AI는 Notion 지식창고를 사용자에게 정확하고 즉각적인 답변을 제공하는 스마트한 24시간 연중무휴 AI 도우미로 바꿔줍니다.

HelpKit AI turns your Notion knowledge base into a smart, 24/7 AI assistant that provides precise and instant answers to your users.

OpenAI, AI 쓰기 감지기가 작동하지 않는다고 확인 / OpenAI Confirms That AI Writing Detectors Don’t Work (1 minute read)

OpenAI는 AI 글쓰기 감지기가 비효율적이라는 사실을 확인했습니다.

OpenAI has confirmed that AI writing detectors are ineffective.