[TLDR] 오늘의 AI 뉴스, 2023-09-21: OpenAI, DALL-E 3 출시 3️⃣, GitHub Copilot Chat 이제 널리 사용 가능 🤖, 의학 분야의 LLM 🩺

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터 의 승인을 받아 AI 소식을 DeepL로 번역 하여 전합니다. :star_struck:
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:
TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

OpenAI, DALL-E 3 출시 / OpenAI launches DALL·E 3 (4 minute read)

DALL-E 3는 이전 시스템보다 훨씬 더 많은 뉘앙스와 디테일을 이해하므로 사용자가 아이디어를 매우 정확한 이미지로 쉽게 번역할 수 있습니다. 이 기능은 곧 ChatGPT에 기본적으로 통합될 예정입니다. dall-e chatgpt openai

DALL·E 3 understands significantly more nuance and detail than previous systems, allowing users to easily translate your ideas into exceptionally accurate images. It will soon be integrated natively into ChatGPT.

GitHub의 AI 기반 코딩 코파일럿을 이제 널리 사용할 수 있습니다 / GitHub’s AI-Powered Coding Copilot Is Now Widely Available (1 minute read)

GitHub는 AI 기반 코딩 챗봇인 Copilot Chat의 가용성을 확장합니다. 이전에는 비즈니스 사용자를 위한 공개 베타 버전으로 제공되던 Copilot Chat을 이제 개인 사용자도 Visual Studio 및 Visual Studio Code에서 사용할 수 있습니다. copilot-chat github-copilot

GitHub is expanding the availability of its AI-powered coding chatbot, Copilot Chat. Previously in public beta for business users, Copilot Chat is now available to individual users in Visual Studio and Visual Studio Code.

TRI는 하룻밤 사이에 로봇을 가르치는 새로운 방법을 개발하고 있습니다 / TRI Is Developing A New Method To Teach Robots Overnight (5 minute read)

도요타 연구소(TRI)는 로봇에게 하룻밤 사이에 새로운 기술을 가르칠 수 있는 연구의 진보를 선보이고 있습니다. TRI는 기존의 로봇 학습 기술과 제너레이티브 AI 모델과 유사한 확산 모델을 활용합니다. 이 시스템은 다양한 환경에서 효과적으로 작동하고 새로운 작업에 적응할 수 있는 로봇을 만드는 것을 목표로 다양한 환경에서의 다재다능함에 중점을 두고 60가지 기술을 학습했습니다.

The Toyota Research Institute (TRI) is showcasing advancements in research that can teach a robot a new skill overnight. TRI utilizes traditional robot learning techniques and diffusion models similar to generative AI models. Its system has been trained on 60 skills, focusing on versatility in different environments, aiming to make robots that can operate effectively in diverse settings and adapt to new tasks.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

OpenPipe: 값비싼 프롬프트를 저렴한 모델로 전환 / Turn expensive prompts into cheap models (GitHub Repo)

OpenPipe는 프롬프트를 통해 동작을 설명하는 몇 개의 샷을 기반으로 모델을 증류하는 도구입니다.

OpenPipe is a tool for model distillation based on few shot described behavior via prompting.

(광고) AI 회사만이 데이터를 스크래핑하는 것은 아닙니다 / AI companies aren’t the only ones scraping your data (Sponsor)

개인 정보가 챗봇에 유출될까 걱정되시나요? 나쁜 소식: 데이터 브로커가 이미 스팸 발송자, 사기꾼, 보험사에게 사용자의 정보를 판매하고 있습니다.
<모든 브로커를 추적하려면 몇 주가 걸릴 것입니다...

그렇다면 Incogni를 사용하여 사용자를 대신하여 수백 건의 삭제 요청을 지속적으로 보내세요."

이 링크 사용 시 50% 할인. 30일 환불 보장. 언제든지 취소하세요

가장 저렴하고 안전한 월 $6.49로 이용할 수 있습니다.

> Worried your PII might end up in a chatbot? Bad news: data brokers are already selling your details to spammers, scammers, and insurers.

It would take you weeks to chase every broker down…

So use Incogni to send hundreds of deletion requests on your behalf, continuously.

50% off with this link. 30-day money back guarantee. Cancel anytime.

Best and safest $6.49 a month you’ll spend.

DFormer: RGB-D 이미지를 더 잘 이해하기 위한 새로운 접근 방식 / A New Approach to Better Understand RGB-D Images (GitHub Repo)

DFormer는 이미지의 색상과 심도를 모두 연구할 수 있는 독특한 방법입니다. 이전 방법과 달리 DFormer는 RGB-D 이미지를 위해 특별히 설계되었습니다. rgb-d

DFormer is a unique way to study both color and depth in images. Unlike older methods, DFormer is designed especially for RGB-D images.

RAG는 단순한 임베딩 검색 그 이상입니다 / Retrieval is more than just embedding search (8 minute read)

언어 모델은 사실에 근거한 쿼리에 대해 정기적으로 세부 사항을 착각합니다. 사실을 검색함으로써 이러한 부정확성을 줄일 수 있습니다. 그러나 쿼리를 임베드하고 벡터 저장소에 대해 검색하는 순진한 형태의 검색 증강 생성(RAG)은 성능이 좋지 않은 경우가 많습니다. 이 게시물에서는 쿼리 객체와 정보 검색 기법으로 성능을 획기적으로 개선하는 방법에 대해 설명합니다. rag

Language models regularly hallucinate details to factual queries. By retrieving the facts, we can reduce these inaccuracies. However, the naive form of Retrieval Augmented Generation (RAG) of embedding a query and searching against a vector store often performs poorly. This post discusses how to dramatically improve performance with query objects and information retrieval techniques.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

RenderIH: 손의 움직임을 이해하는 더 좋은 방법 / A Better Way to Understand Hand Movements (22 minute read)

이 연구에서는 너무 단순했던 기존 데이터 세트의 문제를 해결하는 다양한 위치의 손을 보여주는 초현실적인 이미지 모음인 RenderIH를 소개합니다. 또한 손의 위치를 매우 정확하게 판독하는 새로운 툴인 트랜스핸드(TransHand)도 소개합니다.

This study introduces RenderIH, a massive collection of ultra-realistic images showing hands in various positions that tackles issues with older datasets that were too simple. It also presents TransHand, a new tool that reads these hand positions very accurately.

대규모 언어 모델을 사용하여 권장 사항 강화하기 / Boosting Recommendations Using Large Language Models (13 minute read)

이 연구에서는 여러 기술 분야에 혁신을 불러일으키고 있는 LLM이 어떻게 순차적 추천(예: 다음에 나올 노래나 영화 제안)을 더욱 효과적으로 수행할 수 있는지에 대해 살펴봅니다.

This study looks at how LLMs, which are revolutionizing many tech areas, can make sequential recommendations (like suggesting what song or movie comes next) even better.

의학에서 LLM을 유용하게 활용하기 / Making LLMs Useful in Medicine (11 minute read)

이 연구는 이미 텍스트를 이해하고 생성하는 데 탁월한 능력을 발휘하는 대규모 언어 모델을 의학 질문에 대한 답변에 더욱 효과적으로 활용할 수 있도록 하는 데 중점을 둡니다.

This research focuses on making large language models, which are already great at understanding and generating text, even better at answering medical questions.

:gift: 그 외 소식 / Miscellaneous

The power of two: AI가 기술 및 비즈니스 모델 혁신을 촉발하는 방법 / How AI can spark both technological and business model innovation (2 minute read)

진정한 혁신은 한 쌍으로 이루어집니다. 기술 혁신과 비즈니스 모델 혁신은 함께 작동하여 탁월한 결과를 가져옵니다. AI는 차세대 기술 혁신이지만, 비즈니스 모델 측면에서는 아직 그에 상응하는 혁신을 찾지 못했나요?

Truly great innovation comes in pairs. Technology innovation and business model innovation work together to deliver outlier results. AI is the next technology innovation, but have we found its counterpart on the business model side yet?

제너레이티브 AI의 2막 / Generative AI’s Act Two (15 minute read)

기초 모델과 참신한 앱을 개발하는 제너레이티브 AI의 1막이 끝나가고 있습니다. 이제 제너레이티브 AI가 인간의 문제를 엔드투엔드로 해결하는 2막이 시작됩니다. genai

Generative AI’s first act of developing foundational models and novelty apps is coming to an end. In its place comes Act Two, where generative AI solves human problems end-to-end.

구글이 AI에게 스스로를 의심하도록 가르친 방법 / How Google Taught AI To Doubt Itself (6 minute read)

이제 Google의 바드 챗봇은 사용자의 질문에 대해 웹에서 확증적이거나 모순되는 정보가 있는지 확인하여 답변을 평가하는 '이중 확인' 기능을 제공합니다. 이 기능은 정확성과 책임성을 높이기 위한 것이지만, 여전히 사용자가 검색 결과와 해석을 직접 확인해야 할 수도 있습니다. google-bard

Google's Bard chatbot now offers a "double-check" feature, which evaluates its responses by checking the web for corroborating or contradictory information when prompted by users. This addition aims to enhance accuracy and accountability but may still require users to verify search results and interpretations themselves.

:zap: 더 읽어보기 / Quick Links

마이크로소프트, 특별 이벤트에서 윈도우용 AI 비전 발표 / Microsoft Will Lay Out It’s AI Vision For Windows At Special Event (3 minute read)

Microsoft는 Windows, Microsoft 365, Surface 등에 AI를 통합하는 비전을 공개하는 특별 이벤트를 계획하고 있습니다. microsoft

Microsoft is planning a special event to unveil its vision for integrating AI into Windows, Microsoft 365, Surface, and more.

인공지능에게 "심호흡을 하라"고 말하면 수학 점수가 치솟는다 / Telling AI To “Take A Deep Breath” Causes Math Scores To Soar (4 minute read)

구글은 '차근차근 생각해 보자'와 같은 인간식 격려를 통해 학습자의 수학 능력을 향상시키는 기술인 OPRO(Optimization by PROmpting)를 개발했습니다. opro

Google has developed Optimization by PROmpting (OPRO), a technique to improve the math skills of LLMs using human-style encouragement, such as “let’s think step by step”.

OneAudio (Product)

음성 녹음을 깔끔하게 요약된 노트로 변환하세요.

Transform voice recordings into clean summarized notes.