[TLDR] 오늘의 AI 뉴스 @ 2023-05-04

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :smiley_cat:

image


:rocket: Headlines & Launches

前 DeepMind 리더가 만든 스타트업 Inflection AI에서 챗봇 Pi 출시 (Inflection AI, Startup From Ex-DeepMind Leaders, Launches Pi — A Chattier Chatbot (8 minute read))

Inflection AI의 새로운 챗봇인 Pi는 과거의 상호작용을 기억하고 다양한 작업을 도와주는 기능을 통해 경쟁사보다 더 개인적이고 대화적인 경험을 제공합니다. Mustafa Suleyman CEO에 따르면 오늘 출시한 Pi는 '능동적 경청자'를 목표로 하며, 궁극적으로는 일정 관리, 회의 준비, 새로운 기술 학습을 지원할 예정이라고 합니다. AI 시장은 이미 챗봇으로 포화 상태이지만, 2억 2,500만 달러의 자금 지원을 받은 Inflection AI는 "사용자의 관심사에 맞춰진" 개인용 AI를 제공하는 데 중점을 두고 두각을 나타내기를 희망하고 있습니다.

Inflection AI's new chatbot, Pi, offers a more personal and conversational experience than its competitors, with the ability to remember past interactions and help users with various tasks. Launched today by CEO Mustafa Suleyman, Pi aims to be an "active listener" and will eventually assist in organizing schedules, prepping for meetings, and learning new skills. While the AI market is already saturated with chatbots, Inflection AI, backed by $225 million in funding, hopes to stand out with a focus on providing a personal AI that is "singularly aligned to your interests."

LLM과 생성형 AI에 대한 2개의 온라인 코스 (Two New Courses on Large Language Models and Generative AI (Online Courses))

대규모 언어 모델(LLM)과 생성적 AI에 관한 2개의 온라인 공개 강좌(MOOC)가 시작됩니다. 첫 번째 강좌는 자신만의 애플리케이션을 구축하는 방법을 알려주고, 두 번째 강좌는 데이터 레이크하우스에서 처음부터 LLM을 구축하는 방법에 대한 모든 것을 알려줍니다.

2 Online Open Courses (MOOCs) on Large Language Models (LLMs) and Generative AI are launched. The first one teaches how to build your own applications, the second one teaches everything about building LLMs from scratch on a data lakehouse.

Checks, 구글의 AI 기반 개인정보 보호 플랫폼 (Checks, Google’s AI-powered privacy platform (2 minute read))

Google은 기업의 Google Play 및 iOS 앱에 대한 개인정보 보호 규정 준수를 지원하는 AI 기반 플랫폼인 Checks를 완전히 통합했습니다. Google의 대규모 언어 모델과 앱 이해 기술을 기반으로 하는 Checks는 직관적인 대시보드를 통해 자동화된 분석, 모니터링, 추천 기능을 제공합니다. 이 플랫폼은 게임, 의료, 금융, 교육, 리테일 등 다양한 분야의 글로벌 기업이 개인정보 보호 규정을 효율적으로 준수하는 데 도움을 주고 있습니다.

Google has fully integrated Checks, an AI-powered platform assisting companies with privacy compliance for Google Play and iOS apps. Powered by Google's Large Language Models and app understanding technologies, Checks offers automated analysis, monitoring, and recommendations through an intuitive dashboard. The platform has helped global companies across various sectors, including gaming, health, finance, education, and retail, efficiently navigate privacy compliance.

:brain: Research & Innovation

모두가 소형 모델에 열광하고 있지만, 과연 LLM을 따라잡을 수 있을까? (Everyone is excited about small models, but can they catch up? (12 minute read))

대형 언어 모델(LLM)은 작은 모델보다 더 잘 추론하는 경향이 있습니다. 이러한 추론은 어려운 작업을 해결하는 데 도움이 되며 언어 모델이 차세대 계산 플랫폼/운영 체제의 기반이 될 수 있습니다. 코드, 연쇄 사고 프롬프트, RL에 대한 교육은 모두 추론 능력을 향상시키는 경향이 있습니다. 문제는 이러한 기법이 소규모 모델과 대규모 모델 간의 격차를 해소할 수 있는지 여부입니다.

Large language models tend to reason better than small models. This reasoning helps solve hard tasks and may allow language models to serve as the foundation for the next-generation computation platform/operating system. Training on code, chain of thought prompting, and RL all tend to improve reasoning ability. The question then becomes if these techniques can bridge the gap between smaller and larger models

인과 관계 추론에 탁월한 GPT4 (GPT4 excels at causal reasoning (50 minute read))

상관관계가 인과관계가 아니라는 것은 알고 있지만, 상관관계를 찾도록 훈련된 모델이 인과관계를 밝혀낼 수 있을까요? 그럴 수 있는 것으로 밝혀졌습니다! 인과 관계 발견, 인과 관계 추론 등 여러 가지 흥미로운 벤치마크에서 최근의 OpenAI 모델 세트는 놀랍도록 뛰어난 성능을 보여줍니다. 하지만 놀랍고 다소 직관적이지 않은 실패 모드도 보여주어 아직 갈 길이 멀다는 것을 의미합니다.

We know that correlation is not causation, but do models trained to find correlations uncover causations? It turns out they may be able to! On a number of interesting benchmarks, including causal discovery, and causal reasoning, the recent set of OpenAI models are surprisingly capable. However, they also show really surprising and somewhat non-intuitive failure modes which means we still have a way to go

Unlimiformer: 입력 길이가 무제한인 장거리 트랜스포머 (Unlimiformer: Long-Range Transformers with Unlimited Length Input (17 minute read))

Unlimiformer는 모든 트랜스포머 기반 모델에서 사용할 수 있는 새로운 방법으로, 매우 긴 입력 텍스트를 제한 없이 처리할 수 있습니다. 이 멋진 기법은 BART 및 Longformer와 같은 모델을 개선하여 매우 긴 텍스트, 심지어 책 전체를 잘라내지 않고도 요약할 수 있게 해줍니다.

Unlimiformer is a new method that can work with any transformer-based model, making it possible to handle really long input text without limits. This cool technique improves models like BART and Longformer, allowing them to summarize super long texts, even entire books, without cutting anything out.

:technologist: Engineering & Resources

1주일 만에 SOTA 코드 LLM 학습하기 (Training A SOTA Code LLM In 1 Week (70 minute listen))

레플릿의 AI 책임자인 레자 샤바니(Reza Shabani)와의 독점 인터뷰를 통해 데이터 플랫폼 구축, 고스트라이터 구축, 그리고 현재 2,200만 명의 개발자를 위한 자체 LLM 교육에 이르기까지 레플릿의 여정에 대한 이야기를 들어보실 수 있습니다.

An exclusive interview with Reza Shabani, Replit’s Head of AI, to tell the story of Replit’s journey into building a data platform, building GhostWriter, and now training their own LLM, for 22 million developers.

Pick-a-Pic: 텍스트-이미지 생성을 위한 사용자 기본 설정의 오픈 데이터 세트(GitHub Repo)

Pick-a-Pic이라는 웹 앱은 사람들이 이미지를 생성하고 선호도를 공유할 수 있도록 만들어졌으며, 이를 통해 PickScore라는 초스마트 점수 시스템을 훈련하기 위한 대규모의 개방형 데이터 세트가 만들어졌습니다. PickScore는 사람들이 무엇을 좋아하는지 예측하는 데 탁월하며 텍스트-이미지 모델을 평가하는 다른 방법보다 더 잘 작동하므로 향후 사용을 권장합니다.

A web app called Pick-a-Pic was created to let people generate images and share their preferences, making a big, open dataset for training a super smart scoring system called PickScore. PickScore is great at predicting what people like and works better than other methods for evaluating text-to-image models, so it's recommended for future use.

Text-to-Motion Retrieval (3 minute read)

TMR은 텍스트를 기반으로 3D 사람의 동작을 찾는 데 도움이 되는 새로운 방법으로, 이전 기술을 개선했습니다. 이 기술은 매우 잘 작동하며 중간 등급을 54에서 19로 낮춰 모션과 텍스트 설명을 훨씬 더 잘 일치시킵니다.

TMR is a new method that helps find 3D human motions based on text, improving on previous techniques. It works really well and even reduces the median rank from 54 to 19, making it much better at matching motions to text descriptions.

:gift: Miscellaneous

AI Singers Are Unnervingly Good And Already Ubiquitous (6 minute read)

무료 오픈 소스이며 로컬에서 실행되는 프로그램인 SoftVC VITS 노래 음성 변환 또는 So-Vits-SVC를 사용하여 AI 음악을 얼마나 쉽게 만들 수 있는지에 대한 프로필입니다.

A profile into how easy it is to make AI music using SoftVC VITS Singing Voice Conversion, or So-Vits-SVC, a free, open-source, and locally-run program.

Amazon Plans To Boost Alexa With AI Technology (5 minute read)

인사이더가 입수한 유출 문서에 따르면 아마존의 CEO 앤디 재시는 ChatGPT와 유사한 기능으로 음성 어시스턴트를 다시 시작할 큰 계획을 가지고 있다고 합니다.

Amazon CEO Andy Jassy has big plans to reboot the voice assistant with ChatGPT-like features, a leaked document seen by Insider said.

ChatGPT May Be Leading A Mental Health Revolution (5 minute read)

알자지라에서는 AI 기반 치료 도구의 부상에 대해 논의하며 접근성 및 편의성 향상과 같은 잠재적 이점과 효과성, 개인정보 보호, 정신 건강 관리에서 인간 상호 작용을 대체할 위험성 등의 우려를 모두 강조합니다.

Al Jazeera discusses the rise of AI-powered therapy tools, highlighting both the potential benefits, such as increased accessibility and convenience, and concerns, including questions about effectiveness, privacy, and the risk of replacing human interaction in mental health care.

:zap: Quick Links

Chegg Attributes Drop In Business To ChatGPT (1 minute read)

에듀테크 플랫폼 Chegg의 주가는 ChatGPT가 비즈니스에 해를 끼친다고 밝힌 후 40% 하락했습니다.

EdTech platform Chegg shares dropped 40% after the company said ChatGPT is harming its business.

Grimes Unveils Software To Mimic Her Voice (1 minute read)

Grimes는 인공지능 음성 소프트웨어인 엘프테크(Elf.Tech)를 공개했는데, 이 소프트웨어를 사용하면 Grimes 자신의 목소리로 역류에 대한 보컬을 녹음하거나 업로드할 수 있습니다.

Grimes has unveiled an AI voice software, Elf.Tech, which invites you to record or upload vocals for regurgitation in Grimes’ own voice.

OpenLLaMA (GitHub Repo)

Meta AI의 LLaMA 대규모 언어 모델에 대한 허가된 오픈 소스 복제본입니다.

A permissively licensed open source reproduction of Meta AI's LLaMA large language model.

Chat Chat (GitHub Repo)

Chat Chat을 사용하면 OpenAI, Microsoft Azure, Claude, Cohere, Hugging Face 등의 여러 API를 사용하여 AI 대화 환경을 더욱 풍부하게 만들 수 있습니다.

Chat Chat allows you to use multiple APIs from OpenAI, Microsoft Azure, Claude, Cohere, Hugging Face, and more to make your AI conversation experience even richer.

folk 2.0 (Product Launch)

folk는 사용자를 위해 동작하는 CRM입니다. 가볍고, 사용자 지정이 가능하며, AI를 기반으로 하여 보다 강력한 관계를 쉽게 구축할 수 있습니다.

folk is the CRM that works for you, not the other way around. It’s lightweight, customizable, and powered with AI to let you easily build stronger relationships.

2개의 좋아요

대박이네여 !!

1개의 좋아요

대박이네여 !! (2)