파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다.
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요!
주요 뉴스 & 신규 출시 소식 / Headlines & Launches
ChatGPT 엔터프라이즈 / ChatGPT enterprise (5 minute read)
이제 기업용으로 큰 인기를 끌고 있는 언어 모델의 안전한 비공개 버전이 출시되었습니다. 이 버전은 2배 더 빨라지고, 32k 컨텍스트 길이와 사용 제한이 없으며, SOC2 준수를 통해 보안이 크게 개선되었습니다. 이 기사에서 흥미로운 통계는 포춘지 선정 500대 기업 중 80%가 직원들이 ChatGPT를 사용하도록 등록했다는 것입니다.
A secure and private version of the massively popular language model is now available for enterprises. It seems to be 2x faster, with a 32k context length and no usage limits, and has significant security improvements with SOC2 compliance. An interesting statistic of the article is that 80% of all Fortune 500 companies have had employees sign up to use ChatGPT.
AI 현황 보고서 - 컴퓨팅 파워 인덱스 / State of AI report - compute index (4 minute read)
모든 사람이 얼마나 많은 A100을 보유하고 있나요? 이 보고서는 컴퓨팅을 크게 과소평가하고 있을 가능성이 높지만, 부분적인 순서는 맞는 것 같습니다. 주목할 만한 점은 화웨이의 칩을 사용한 논문 7편이 발표되었다는 점입니다.
How many A100s does everyone have? This report likely dramatically underestimates compute, but the partial ordering seems correct. Of note - 7 published papers using Huawei's chip.
(더 읽어보기 AI 현황 보고서 : 컴퓨팅 파워 인덱스 (State of AI Report - Compute Index))
알리바바, 두 가지 새로운 모델 출시 / Alibaba Launches Two New Models (1 minute read)
알리바바는 두 가지 새로운 인공지능 모델을 출시했습니다: Qwen-VL과 Qwen-VL-Chat. 이 모델은 이미지를 이해하고 더 복잡한 대화를 수행할 수 있다고 합니다.
Alibaba has launched two new artificial intelligence models: Qwen-VL and Qwen-VL-Chat. The company says the models can understand images and carry out more complex conversations.
연구 & 혁신 관련 소식 / Research & Innovation
AudioLDM2: 오픈소스 사운드 및 음악 생성 / Open source sound and music generation (GitHub Repo)
빠르게 실행되고 비트, 음향 효과 및 기본 대화를 생성하는 훌륭한 모델입니다. 실행하기 쉽고 프롬프트 스타일에 상당히 견고한 것 같습니다.
An excellent model that runs quickly and generates beats, sound effects, and basic dialogue. It is easy to get running and seems to be fairly robust to prompting style.
Lagent (GitHub Repo)
LLM 기반 에이전트를 구축하기 위한 경량 프레임워크입니다.
A lightweight framework for building LLM-based agents.
Prompt2Model (GitHub Repo) / Prompt2Model (GitHub Repo)
Prompt2Model은 자연어 작업 설명을 받아 배포에 도움이 되는 소규모 특수 목적 모델을 학습하는 시스템입니다.
Prompt2Model is a system that takes a natural language task description to train a small special-purpose model that is conducive for deployment.
(더 읽어보기 Prompt2Model - 명령어로 배포 가능한 모델을 생성)
엔지니어링 및 리소스 관련 소식 / Engineering & Resources
NRHints: 더 적은 수의 사진으로 3D 오브젝트 조명 / 3D Object Lighting with Fewer Photos (2 minute read)
이 연구에서는 몇 장의 사진만으로 빛이 3D 오브젝트와 상호작용하는 방식을 재현하는 새로운 방법을 소개합니다. 기존 기법과 달리 그림자와 하이라이트에 대한 힌트를 영리하게 사용하여 다양한 모양과 재질을 보다 효과적으로 처리할 수 있습니다.
This research introduces a new method to recreate how light interacts with 3D objects, using just a few pictures of that object. Unlike older techniques, our system cleverly uses hints about shadows and highlights, allowing it to handle various shapes and materials more effectively.
ReST: 2단계 그래프 모델을 사용한 멀티 카메라 오브젝트 트래킹 / Multi-Camera Object Tracking with a Two-Stage Graph Model (GitHub Repo)
이 연구에서는 공간과 시간 모두에 초점을 맞춘 멀티 카메라 멀티 오브젝트 트래킹(MC-MOT)을 위한 새로운 그래프 모델을 소개합니다. 이 모델은 종종 실수를 범하는 이전 방법과 달리 먼저 여러 카메라에 걸쳐 객체를 연결한 다음 시간이 지남에 따라 해당 정보를 사용하여 보다 정확하고 실제 사용 가능한 추적 기능을 제공합니다.
This study introduces a new graph model for Multi-Camera Multi-Object Tracking (MC-MOT) that focuses on both space and time. Unlike previous methods that often make mistakes, this model first connects objects across different cameras and then uses that info over time, making tracking more accurate and ready for real-world use.
DFER-CLIP: 얼굴 표정 인식을 위한 새로운 시각 언어 모델 / A New Visual-Language Model for Recognizing Facial Expressions (GitHub Repo)
이 연구에서는 실제 시나리오에서 변화하는 얼굴 표정을 인식하기 위해 특별히 CLIP 모델을 개선한 DFER-CLIP 모델을 공개합니다.
This study unveils the DFER-CLIP model, which enhances the CLIP model specifically for recognizing changing facial expressions in real-world scenarios.
그 외 소식 / Miscellaneous
언어 모델을 이용한 그래프 기반 프롬프트 및 추론 / Graph-Based Prompting And Reasoning With Language Models (20 minute read)
추론 과정을 체인이나 트리가 아닌 그래프 구조로 모델링하여 문제를 추론할 때 발생할 수 있는 다양한 유형의 비선형 패턴을 더 잘 포착하는 몇 가지 프롬프트 기법에 대한 개요입니다.
An overview of the several prompting techniques that model the reasoning process as a graph structure—rather than a chain or tree—that better captures the various types of non-linear patterns that may occur when reasoning over a problem.
AGI는 어떻게 관리할 것인가? / How Do We Govern AGI? (10 minute read)
이 문서에서는 위험을 최소화하고 상승 여력을 극대화하기 위해 평가, 접근 제어 및 국제 감독에 중점을 둔 고급 AI 시스템의 거버넌스 전략을 살펴봅니다.
This article examines governance strategies for advanced AI systems, focusing on evaluations, access control, and international oversight, with the goal of minimizing risk and maximizing upside.
LLM은 혼돈의 대리인 / LLMs Are Agents Of Chaos (5 minute read)
AI에 대한 관심이 실용적인 애플리케이션에 대한 관심으로 전환되면서, 특히 LLM의 경우 그 결과를 예측할 수 없기 때문에 몇 가지 도전 과제가 드러났습니다. 엔지니어와 기업은 구조화된 결과를 위해 혼돈을 통제하는 데 어려움을 겪고 있으며, 예술가들은 일자리 대체와 법적 문제에 대한 두려움으로 AI 도입을 주저하고 있어 예술적 잠재력을 발휘하기 위해서는 더욱 정교한 AI 모델이 필요할 수 있습니다.
The excitement around AI has transitioned into a focus on practical applications, which has brought to light some challenges, particularly with LLMs as their outputs can be unpredictable. Engineers and businesses grapple with controlling chaos for structured results, while artists' hesitation to adopt AI stems from fears of job displacement and legal issues, suggesting that edgier AI models may be necessary for unlocking artistic potential.
더 읽어보기 / Quick Links
도어대시, AI 응답 서비스 출시 / DoorDash Is Launching An AI Answering Service (1 minute read)
DoorDash는 테이크아웃이나 배달을 주문할 때 AI로 전화를 걸 수 있는 레스토랑용 새로운 응답 서비스를 출시합니다.
DoorDash is launching a new answering service for restaurants that could put you on the phone with AI when ordering takeout or delivery.
GPT 파일럿 / GPT Pilot (GitHub Repo)
개발자가 구현을 감독하는 동안 전체 앱을 처음부터 작성하는 확장 가능한 개발 도구입니다.
A scalable dev tool that writes entire apps from scratch while the developer oversees the implementation.
Microsoft, Bing AI에 Google Chrome 지원 추가 / Microsoft Adds Google Chrome Support To Bing AI (1 minute read)
이번 주부터 Microsoft는 Bing AI에 대한 Google Chrome 지원을 공식적으로 시작합니다.
As of this week, Microsoft is officially launching Google Chrome support for Bing AI.