[TLDR] 오늘의 AI 뉴스, 2023-08-02: 메타의 AI '페르소나' 🧑‍💻, 우버 챗봇 🤖, 자동 음악 캡션 🎵

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :star_struck:

더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:

TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

Meta의 AI '페르소나', 다음 달 출시 예정 / Meta’s AI ‘Personas’ Might Launch Next Month (3 minute read)

Meta는 빠르면 다음 달에 AI 기반 '페르소나'를 서비스에 출시하여 사용자가 제품을 검색하고, 추천을 받고, 다른 방식으로 제품에 참여할 수 있는 새로운 방법을 제공할 수 있습니다.

Meta could launch AI-powered “personas” on its services as soon as next month, giving users a new way to search, get recommendations, and otherwise engage with its products.

Uber, 챗봇 개발 중 / Uber Is Developing A Chatbot (2 minute read)

Uber는 앱에 통합할 AI 기반 챗봇을 개발하고 있습니다.

Uber is developing an AI-powered chatbot to integrate into its app.

LinkedIn, 구직 활동을 지원하는 AI "코치"를 계획 중 / LinkedIn Seems To Be Planning An AI “Coach” To Assist You With Job Searching (2 minute read)

LinkedIn은 사용자의 구직, 지원, 회사 문화 등의 조사를 지원하는 AI "코치"의 출시를 계획하고 있는 것으로 보입니다.

LinkedIn seems to be planning the release of an AI "coach" to assist users with job searching, applications, and researching things like a company's culture.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

DisCo: AI-기반 춤 영상 생성 / AI-based Dance Generation (GitHub Repo)

AI가 실제와 같은 유연성을 갖춘 인간의 댄스 비디오를 만들 수 있으면 좋겠다고 생각한 적이 있나요? 이것이 바로 DisCo 모델이 하는 일입니다! 이 모델은 참조 이미지를 사용하여 사람 피사체와 배경의 모습을 유지하면서 댄스 포즈를 정확하게 따라갈 뿐만 아니라 이전에 본 적이 없는 새로운 피사체, 배경, 포즈에도 적응할 수 있습니다.

Ever wished AI could create human dance videos that are true-to-life and flexible? That's what the DisCo model does! It not only keeps the look of human subjects and backgrounds using a reference image while accurately following the dance pose, it also adapts to new subjects, backgrounds, and poses it's never seen before.

Symphonies: 자율주행을 위한 3D 장면 완성을 위한 새로운 기술 / A New Technique for 3D Scene Completion in Autonomous Driving (GitHub Repo)

심포니는 자율주행을 위한 3D 장면을 완성하기 위해 독특한 접근 방식을 사용하여 LiDAR 또는 이미지와 같은 부분적인 입력의 빈틈을 메웁니다.

Symphonies uses a unique approach to completing 3D scenes for autonomous driving where it fills in the gaps of partial inputs from things like LiDAR or images.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

ToolLlama (24 minute read)

도구 사용은 언어 모델이 특정 API를 호출하도록 트리거하는 단어를 생성하고 그 출력이 다시 언어 모델에 토큰으로 파이프되는 패러다임입니다. 즉, 언어 모델은 계산기, 웹 브라우저, 심지어 코딩 환경까지 사용할 수 있습니다. 최근 강력한 오픈소스 언어 모델이 출시됨에 따라 4만 개 이상의 실행 가능한 API를 수집하고 이를 사용하도록 모델을 미세 조정할 수 있습니다. 이렇게 하면 강력한 툴포머를 얻을 수 있습니다.

Tool use is a paradigm where a language model produces words that trigger certain APIs to be called with the output being piped back in as tokens to the language model. This means that language models can use calculators, web browsers, and even coding environments. With the recent release of powerful open source language models, you can collect 40k+ viable APIs and fine-tune the model to use them. When you do this, you get a powerful Toolformer.

새로운 증류 기법 / A Novel Distillation Technique (35 minute read)

이 연구는 데이터의 구조를 고려하는 방식으로 데이터를 모델링하고 이전 학습을 갑자기 잊어버리는 것을 방지하는 '지식 증류' 기법을 사용하여 신경망이 새로운 학습을 학습하는 동안 과거의 학습을 기억하는 데 도움이 되는 새로운 방법을 제안합니다.

This research proposes a new method that helps neural networks remember past lessons while learning new ones using a 'knowledge distillation' technique that models data in a way that considers its structure and helps prevent sudden forgetting of previous learnings.

LP-MusicCaps: 자동 음악 캡션 생성 / Automatic Music Captioning (22 minute read)

음악에 대해 사람이 읽을 수 있는 설명을 생성하는 것은 대부분의 시스템에서 어려운 일이며, 사람에게는 충분히 어려운 일입니다! 하지만 연구원들은 몇 가지 영리한 데이터 수집 및 라벨링 기술을 통해 다양한 음악 장르에 걸쳐 2.2m의 캡션 데이터셋을 수집할 수 있었습니다. 그런 다음 이 데이터셋을 기반으로 모델을 학습시켰고 놀라운 성능을 얻었습니다.

Producing human-readable descriptions for music is challenging for most systems - it’s challenging enough for people! But with some clever data acquisition and labeling techniques, researchers were able to collect a dataset of 2.2m captions across a wide variety of music genres. They then trained a model on this dataset and got pretty phenomenal performance.

:gift: 그 외 소식 / Miscellaneous

중국의 AI 규제과 그 규제 과정 / China’s AI Regulations And How They Get Made (8 minute read)

카네기 국제평화재단의 연구원 매트 시한이 중국의 AI 규제 프로세스에 관한 새로운 보고서를 검토합니다.

A review of a new report by Matt Sheehan, a fellow at the Carnegie Endowment for International Peace, on China’s AI regulatory process.

사이버 범죄자들이 피싱, 멀웨어 공격을 위해 AI 챗봇을 학습시키는 중 / Cybercriminals Train AI Chatbots For Phishing, Malware Attacks (4 minute read)

WorkGPT와 FraudGPT의 여파로 사이버 범죄자들이 악의적인 용도로 AI 챗봇을 만들고 있다는 것이 분명해졌습니다.

In the wake of WorkGPT and FraudGPT, it is clear that cybercriminals are making AI chatbots for malicious uses.

YouTube, AI 생성 요약 테스트 / YouTube tests AI-generated summaries (1 minute read)

YouTube는 검색 및 시청 페이지에서 AI 생성 요약을 테스트하기 시작했습니다. 이 새로운 AI 요약은 크리에이터가 작성한 동영상 설명을 대체하지는 않습니다.

YouTube has started testing AI-generated summaries on search and watch pages. These new AI summaries won’t replace the video descriptions written by creators.

:zap: 더 읽어보기 / Quick Links

Unthread (Product)

언스레드는 Slack에서 AI 기반 고객 지원을 제공합니다.

Unthread provides AI-powered customer support in Slack.

Pump (Product)

Pump는 AWS에서 최대 60%의 완전 자동화된 비용 절감을 제공하는 무료 도구입니다. AI와 그룹 구매 모델을 결합한 Pump는 알고리즘을 통해 최상의 절감 효과를 최적화합니다.

Pump is a free tool that provides fully automated savings of up to 60% on AWS. Combining AI with a group buying model, Pump algorithmically optimizes the best savings.

Tagalog어를 위한 SpaCy NLP 파이프라인 / NLP pipelines for Tagalog (2 minute read)

동남아시아에서 흔히 사용되는 타갈로그어에 대한 일반적인 NLP 작업을 지원하는 스파시 파이프라인입니다.

spaCy pipelines to help with common NLP tasks in this common Southeast Asian language.