파이토치 한국 사용자 모임에서는 TLDR 뉴스레터 의 승인을 받아 AI 소식을 DeepL로 번역 하여 전합니다.
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요!
주요 뉴스 & 신규 출시 소식 / Headlines & Launches
Reka, 플래그십 멀티모달 모델 출시 / Reka launches their flagship multimodal models (4 minute read)
Yasa-1은 매우 인기 있는 T5 언어 모델 개발자가 만든 오디오, 비디오 및 텍스트 모델입니다. 다양한 작업에서 인상적인 성능을 자랑합니다. Yasa-1은 현재 비공개 미리 보기 중입니다.
Yasa-1 is an audio, video, and text model from the creators of the extremely popular T5 language model. It boasts impressive performance across a number of tasks. Yasa-1 is currently in private preview.
LinkedIn, 새로운 AI 도구로 큰 성공을 거두다 / LinkedIn Goes Big On New AI Tools (2 minute read)
LinkedIn은 구직, 마케팅 및 영업 서비스를 강화하기 위해 일련의 AI 기반 기능을 출시합니다. 여기에는 AI가 통합된 채용 담당자 인재 소싱 플랫폼의 개선된 버전, AI 기반 LinkedIn 학습 코치, 마케팅 캠페인을 위한 새로운 AI 도구가 포함됩니다.
LinkedIn is launching a series of AI-based features to enhance its job hunting, marketing, and sales offerings. These include an improved version of its Recruiter talent sourcing platform with integrated AI, an AI-driven LinkedIn Learning coach, and a new AI tool for marketing campaigns.
생성형 AI 일자리는 계속해서 동일한 대형 기술 허브에 집중될 것입니다 / Generative AI jobs will continue to cluster in the same big tech hubs (9 minute read)
오픈소스 AI의 대중화에도 불구하고 2022년 7월부터 2023년 7월까지 생성된 AI 채용 공고의 60% 이상이 10개 주요 기술 허브에 집중되어 있습니다. AI의 지리적 입지를 다각화하기 위해서는 개입과 연구 프로그램 확대가 필요합니다. genai
Despite open-source AI democratization, over 60% of generative AI job postings from July 2022-2023 were in 10 major tech hubs. Interventions and expanded research programs are needed to diversify AI's geographic footprint.
연구 & 혁신 관련 소식 / Research & Innovation
비전 언어 모델을 통한 이미지 복원 개선 / Better Image Restoration With Vision-Language Models (4 minute read)
CLIP과 같은 비전 언어 모델은 많은 작업에서 잘 작동하지만 이미지 복원에는 어려움을 겪습니다. 이 프로젝트에서는 이러한 작업을 더 잘 처리할 수 있도록 CLIP의 작동 방식을 조정하여 보다 선명한 이미지 재구성을 유도하는 모델인 DA-CLIP을 소개합니다. vision-language clip
Vision-language models like CLIP work well for many tasks but struggle with image restoration. This project introduces DA-CLIP, a model that adjusts how CLIP works to handle these tasks better, leading to clearer image reconstructions.
OnnxStream (GitHub Repo)
라즈베리파이 제로 2에서 스테이블 디퓨전 1.5를 실행할 수 있는 프로그램입니다. onnx onnxstream
A program that enables you to run Stable Diffusion 1.5 on a Raspberry Pi Zero 2.
엔지니어링 및 리소스 관련 소식 / Engineering & Resources
제너럴리스트 로봇 정책 / Generalist robot policy (20 minute read)
로봇의 정책은 로봇의 행동 방식을 결정하는 안내 알고리즘입니다. 일반적으로 로봇과 작업에 따라 다릅니다. 이 때문에 로봇이 적응하기 어렵습니다. Google의 이 새로운 작업은 16만 개 이상의 서로 다른 작업을 수행할 수 있는 단일(55억 개의 매개변수) 정책을 보여줍니다.
A robot's policy is the guiding algorithm that determines how it acts. Typically these are robot and task specific. This makes it hard for robotics to adapt. This new work from Google shows a single (55B parameter) policy that can perform 160k+ different tasks.
Pink: 멀티모달 LLM을 다양한 작업에 적용하기 / Making Multi-modal LLMs Work for Different Tasks (17 minute read)
다중 모드 대규모 언어 모델은 많은 작업에서 뛰어난 성능을 발휘하지만 이미지에서 특정 객체를 정확히 찾아내는 데 어려움을 겪는 경우가 많습니다. 연구원들은 객체 위치를 텍스트로 바꾸고 특수 작업을 통해 모델을 훈련시킴으로써 이를 개선하는 방법을 개발했습니다. multimodal
Multi-modal Large Language Models excel in many tasks but often struggle to pinpoint specific objects in images. Researchers have developed a way to improve this by turning object locations into text and training the model with special tasks.
PC-NeRF: 효율적인 대규모 3D 씬 재구성 / Efficient Large-Scale 3D Scene Reconstruction (16 minute read)
특히 일부 데이터가 누락된 경우 대규모 3D 장면을 재구성하는 것은 자율 주행 자동차에 매우 중요합니다. 이 새로운 방법인 PC-NeRF는 두 개의 모듈을 결합하여 여러 수준에서 재구성을 최적화함으로써 불완전한 데이터로도 상세한 3D 모델을 보장합니다. nerf
Rebuilding large 3D scenes, especially when some data is missing, is crucial for self-driving cars. This new method, PC-NeRF, combines two modules to optimize the reconstruction at multiple levels, ensuring detailed 3D models even with incomplete data.
그 외 소식 / Miscellaneous
자율 주행을 위한 대규모 세계 모델 / Large world models for self driving (8 minute read)
대부분의 자율 주행 시스템은 규칙 기반, 전문가 시스템, 학습 모듈의 대규모 조합이었습니다. Wayve의 이 작업은 다양한 시나리오에서 매우 뛰어난 성능을 발휘하는 9B 조인트 비디오, 액션 및 텍스트 모델을 보여줍니다.
Most self driving systems have been large combinations of rules-based, expert systems, and learned modules. This work by Wayve shows a 9B joint video, action, and text model that performs extremely well in diverse scenarios.
데이터는 여전히 해자인가? / Is Data Still A Moat? (2 minute read)
생성형 AI는 방대한 데이터 수집에 대한 기존의 가치를 재구성하고 있습니다. 최소한의 데이터로 대규모 언어 모델을 미세 조정하고 합성 데이터 세트를 생성할 수 있게 되면서 독점 데이터의 고유성과 중요성이 약화되고 있습니다. genai
Generative AI is reshaping the traditional value placed on vast data collections. As large language models can be fine-tuned with minimal data and even generate synthetic datasets, the uniqueness and importance of proprietary data may be waning.
허리케인 예측을 개선하는 AI / AI Is Getting Better At Hurricane Forecasting (4 minute read)
허리케인 리의 경로를 예측한 것은 엔비디아, 화웨이, 딥마인드의 AI 기반 모델입니다. 과거 대기 데이터의 패턴을 분석하는 이러한 AI 모델은 폭풍 추적에서 기존 모델과 비슷하거나 때로는 더 나은 성능을 보여 주었으며, 몇 시간이 아닌 몇 분 만에 빠른 결과를 제공하여 향후 공식 예보에서 중요한 역할을 할 수 있을 것입니다.
Hurricane Lee's path was predicted by AI-based models from Nvidia, Huawei, and DeepMind. These AI models, which analyze patterns from historical atmospheric data, have shown comparable or sometimes better performance in storm tracking than conventional models, delivering rapid results in minutes instead of hours, and might play a significant role in official forecasts in the coming years.
더 읽어보기 / Quick Links
콜라토 / Collato (Product)
제품 팀이 자체 제품 지식을 기반으로 새로운 콘텐츠를 찾고, 요약하고, 생성할 수 있도록 도와주는 AI 비서입니다. open-assistant ai-product
AI assistant for product teams to find, summarize, and generate new content based on their own product knowledge.
(광고) Dystr: 자율 에이전트를 갖춘 AI 기반 엔지니어링 허브 / Dystr: AI powered engineering hub with autonomous Agents (Sponsor)
엔지니어링 자료의 데이터 분석 및 저장을 위해 설계된 LLM이 통합된 협업 클라우드 환경입니다. 내장된 AI 에이전트를 통해 Dystr은 워크로드를 자동화하여 엔지니어가 핵심 업무에 집중할 수 있도록 지원합니다. Google, Valve, Meta, SpaceX의 엔지니어 대열에 합류하세요.
무료 크레딧으로 시작하세요!
A collaborative, LLM-infused cloud environment designed for data analysis and storage of engineering materials. With built-in AI Agents, Dystr automates workloads, freeing engineers to focus on core tasks. Join the ranks of engineers at Google, Valve, Meta, & SpaceX.
Start with free credits!
국가안보국이 AI 보안 센터를 시작합니다 / The National Security Agency Is Starting An AI Security Center (2 minute read)
미국 국가안보국은 미국 국방 및 정보 시스템에 AI를 빠르게 통합하는 추세에 발맞추기 위해 인공지능 보안 센터를 설립합니다. ai-security
The National Security Agency is starting an artificial intelligence security center in order to keep pace with the rapid integration of AI into U.S. defense and intelligence systems.
스트럿 / Strut (Product)
Strut는 대략적인 노트를 완성도 높은 콘텐츠로 바꿔주는 AI 노트북입니다.
Strut is an AI notebook that turns rough notes into finished content.