[TLDR] 오늘의 AI 뉴스, 2023-07-18: Wix의 AI 사이트 생성기 💻, 구글의 노트북LM 📓, 스토리를 영화로 바꾸기 🎥

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :star_struck:

더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:

TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

프롬프트에서 웹사이트를 생성하는 Wix의 새로운 도구 / Wix’s New Tool Can Create Websites From Prompts (3 minute read)

Wix의 새로운 AI 사이트 생성기 도구를 사용하면 사용자가 의도를 설명하고 홈페이지, 내부 페이지, 텍스트 및 이미지가 포함 된 웹 사이트를 생성 할 수 있습니다.

Wix’s new AI Site Generator tool lets users describe their intent and generate a website complete with a homepage, inner pages, text, and images.

NotebookLM 소개 / Introducing NotebookLM (3 minute read)

Google은 AI 기반의 실험적인 노트 필기 소프트웨어인 NotebookLM을 출시했습니다.

Google has released NotebookLM, an experimental note taking software powered by AI.

워싱턴: AI가 우리를 더 건강하게 만들까요? / Washington: Will You Let AI Make Us Healthier? (4 minute read)

안드레센 호로위츠는 한동안 AI의 미덕을 찬양해 왔으며, 이제는 생명공학과 의료 분야로 관심을 돌려 워싱턴의 지도자들이 왜 이 문제를 해결해야 하는지에 대한 사례를 제시하고 있습니다.

Andreessen Horowitz has been extolling the virtues of AI for some time, and now they have turned their attention to biotechnology and healthcare, laying out their case for why the leaders in Washington should get the heck out of the way.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

mBLIP - 비용 효율적인 다국어 비전-언어 모델 / mBLIP - A Cost-Efficient, Multilingual Vision-Language Model (GitHub Repo)

이 연구는 사전 학습된 다국어 대규모 언어 모델을 활용하여 이미지 인코더를 여러 언어로 효율적으로 '이해'하는 최초의 다국어 비전-언어 모델인 mBLIP을 소개하며, 일반적으로 고비용의 학습을 통해 달성할 수 있는 기능입니다.

The research introduces mBLIP, the first multilingual vision-language model, which leverages a pre-trained multilingual large language model to 'understand' image encoders efficiently and in multiple languages, a feature typically accomplished with high-cost training.

Animate-A-Story: 혁신적인 텍스트-비디오 합성 프레임워크 / Turn Stories into Movies: An Innovative Text-to-Video Synthesis Framework (2 minute read)

이 프로젝트는 스토리의 줄거리에 따라 기존 비디오 클립의 모양을 사용자 지정하여 서면 스토리를 일관성 있는 비디오로 변환할 수 있는 획기적인 방법을 소개합니다.

This project introduces a groundbreaking method that can transform written stories into coherent videos by customizing the appearances of existing video clips based on the plot of the story.

Video-FocalNet: 더 나은 비디오 인식 시스템 / Video-FocalNet: A Better Video Recognition System (3 minute read)

이 프로젝트는 트랜스포머와 컨볼루션 모델의 장점을 결합한 효율적이고 효과적인 비디오 인식 시스템인 Video-FocalNet을 소개합니다. 비디오-포컬넷은 비디오의 로컬 및 글로벌 컨텍스트를 효율적으로 분석하는 고유한 방법을 사용하여 여러 대규모 데이터셋에서 최고 수준의 트랜스포머 기반 모델과 비교하여 놀라운 성능을 발휘합니다.

The project presents Video-FocalNet, an efficient and effective system for video recognition that merges the benefits of both Transformer and convolutional models. Video-FocalNet uses a unique method to efficiently analyze both the local and global context of videos, performing remarkably well against top-tier transformer-based models on several large datasets.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

문맥 내 예제 검색 학습 / Learning to retrieve in-context examples (23 minute read)

이 논문에서는 대규모 언어 모델(LLM)의 학습 방식을 개선하기 위한 새로운 방법을 소개합니다. 이 방법은 LLM이 학습하기에 가장 적합한 예문을 찾는 시스템을 사용합니다. 이 방법은 LLM의 피드백을 사용하여 모델을 학습시킨 다음, 이 모델을 사용하여 '리트리버'를 학습시켜 좋은 예제를 찾습니다. 테스트 결과 이 방법을 사용하면 여러 작업에서 LLM이 더 잘 학습하는 것으로 나타났습니다. 심지어 학습되지 않은 작업과 모든 규모의 LLM에서도 잘 작동합니다. 향상된 학습 능력은 리트리버가 학습할 유사한 예제를 찾기 때문인 것으로 보입니다.

This paper introduces a new method for improving how large language models (LLMs) learn. The method uses a system that finds the best examples for LLMs to learn from. It uses feedback from an LLM to train a model, then it uses the model to train a 'retriever' to find good examples. Tests show that the method makes LLMs learn better across many tasks. It even works well on tasks it wasn't trained on and on LLMs of all sizes. The improved learning seems to come from the retriever finding similar examples to learn from.

언어 모델은 도덕적 추론에 서툴다 / Language models are bad at moral reasoning (23 minute read)

최근 실리콘밸리의 일부 석학들은 도덕적 추론은 능력이 향상됨에 따라 개선되기 때문에 AI가 큰 위험을 초래하지 않는다고 주장하고 있습니다. 이 논문은 현대 언어 모델이 도덕적 추론 작업을 제대로 수행하지 못한다는 것을 보여줌으로써 이러한 생각에 대한 구체적인 논거를 제시합니다.

Recently, some Silicon Valley big thinkers have argued that AI doesn't pose a significant risk because they claim moral reasoning improves as capabilities improve. This paper provides concrete arguments against that idea, showing that modern language models perform poorly at moral reasoning tasks.

FlashAttention-2 (20 minute read)

플래시 어텐션은 1년여 전에 처음 등장했으며 주의력 계산 속도를 높이는 표준 방법으로 빠르게 채택되었습니다. 이제 이 놀라운 기술의 두 번째 버전이 출시되었으며, 기존 어텐션 구현보다 성능이 5-9배 향상되었다고 합니다.

Flash attention came out a year or so ago and has quickly been adopted as the standard way to speed up attention calculations. Now, the second version of this amazing technique is out, with a purported 5-9x improved performance over traditional attention.

:gift: 그 외 소식 / Miscellaneous

구글, 의료 산업을 깨기 위해 의료 인공지능 프로그램에 베팅하는 중 / Google Bets On Medical AI Program To Crack Healthcare Industry (5 minute read)

구글은 의료 질문에 전문적으로 답하도록 학습된 인공지능 프로그램을 테스트하고 있으며, 최근의 인공지능 발전을 임상의들이 널리 사용할 수 있는 제품으로 전환하기 위해 마이크로소프트 등 경쟁사들과 경쟁하고 있습니다.

Google is testing an artificial intelligence program trained to expertly answer medical questions, racing against rivals, including Microsoft, to translate recent AI advances into products that would be used widely by clinicians.

Openchat Orca 미리보기 / Openchat Orca preview (3 minute read)

또 다른 날, 또 다른 증류(distillation). GPT-4로 오르카를 설명합니다.

Another day, another distillation. This one uses explanation traces from GPT4 ala Orca.

AI가 발명할 수 있을까요? / Can AI Invent? (5 minute read)

이 글에서는 최근 인공지능 시스템에 대한 특허 발급에 대해 논의하며, 인간이 아닌 존재에게 지적 재산권을 부여하는 것이 갖는 법적, 윤리적 의미에 대한 의문을 제기합니다.

The article discusses the recent issuance of a patent to an AI system, raising questions about the legal and ethical implications of granting intellectual property rights to non-human entities.

:zap: 더 읽어보기 / Quick Links

Codejet AI (Product)

피그마 디자인을 상용으로 바로 사용할 수 있는 깔끔한 코드로 빠르게 변환하세요.

Quickly transform your Figma designs into clean, production-ready code.

크리에이터들은 AI가 더 창의적인 콘텐츠로 이어진다고 말합니다 / Creators Say AI Leads To More Creative Content (5 minute read)

Descript와 입소스가 1,000명 이상의 팟캐스터, 유튜버, 숏폼 동영상 제작자를 대상으로 실시한 새로운 설문조사에 따르면 이들 중 약 3분의 2가 이미 콘텐츠 제작에 생성형 AI를 사용했으며, 4분의 3 이상이 앞으로 AI 도구를 사용할 가능성이 있다고 답했습니다.

A new survey of more than 1,000 podcasters, YouTubers, and short-form video creators conducted by Descript and Ipsos reveals that nearly two-thirds of those creators have already used generative AI in their content production and more than three-quarters say they are likely to use AI tools moving forward.

Poster Studio (Product)

AI 기반 광고 및 소셜 크리에이티브로 ROI 극대화.

Maximize ROI with AI-Powered Ad & Social Creatives.

MetaGPT (GitHub Repo)

MetaGPT는 한 줄의 요구사항을 입력으로 받아 사용자 스토리, 경쟁사 분석, 요구사항, 데이터 구조, API 및 문서를 출력합니다.

MetaGPT takes a one line requirement as input and outputs user stories, competitive analysis, requirements, data structures, APIs, and documents.