파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다.
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요!
주요 뉴스 & 신규 출시 소식 / Headlines & Launches
Cohere의 2억 7천만 달러 시리즈 C 투자 유치 / Cohere's $270M Series C (5 minute read)
Cohere는 언어 모델을 지속적으로 개발하고 이를 제품 조직에 제공하기 위해 대규모 자금을 확보했습니다.
Cohere has secured a large round of funding to continue developing their language models and serving them to product organizations.
딥마인드, 코드와 인프라 최적화를 위해 게임 플레이 AI의 용도를 변경 / DeepMind repurposes game-playing AIs to optimize code and infrastructure (4 minute read)
딥마인드의 알파 시리즈 AI는 다양한 Google 작업을 최적화했습니다: AlphaZero는 데이터센터 작업 할당을 개선하고 하드웨어 사용량을 19% 줄였으며, MuZero는 YouTube 동영상 압축을 개선했고, AlphaDev는 정렬 알고리즘과 해싱 기능을 개선하여 부하를 30% 줄였습니다.
DeepMind's Alpha series AIs have optimized various Google tasks: AlphaZero has improved data center task allocation and reduced hardware underuse by 19%, MuZero enhanced YouTube video compression, and AlphaDev improved sorting algorithms and hashing functions, resulting in a 30% reduced load.
Meta, AI를 모든 곳에 배치할 계획 / Meta Plans To Put AI Everywhere (2 minute read)
메타의 CEO인 마크 저커버그는 목요일 직원들에게 페이스북과 인스타그램과 같은 주력 제품에 생성형 AI 텍스트, 이미지, 동영상 생성기를 탑재할 계획을 발표했습니다.
Meta CEO Mark Zuckerberg announced a plan to employees on Thursday that will see the company put generative AI text, image, and video generators into its flagship products such as Facebook and Instagram.
연구 & 혁신 관련 소식 / Research & Innovation
Bard API (GitHub Repo)
API를 통해 구글 바드의 응답을 반환하는 Python 패키지입니다.
A Python package that returns responses from Google Bard via an API.
중국의 동영상 이해를 위한 게임 체인저 데이터셋 / A Game Changer Dataset for Chinese Video Understanding Task (GitHub Repo)
이 논문에서는 현재까지 가장 큰 규모의 공개 중국어 동영상 언어 데이터 세트인 Youku-mPLUG를 소개합니다. 이 데이터셋은 중국의 인기 동영상 공유 플랫폼인 Youku에서 선별된 1,000만 개의 동영상-텍스트 쌍으로 구성되어 있습니다. 이 데이터셋와 연구자들의 혁신적인 사전 훈련 모델인 mPLUG-video의 도움으로 크로스 모달 검색, 비디오 캡션, 비디오 카테고리 분류와 같은 비디오 언어 작업에서 상당한 진전이 이루어졌습니다.
This paper presents Youku-mPLUG, the largest public Chinese video-language dataset to date. It consists of 10 million curated video-text pairs from Youku, a popular Chinese video-sharing platform. With the help of this dataset and researchers’ innovative pre-training models like mPLUG-video, significant advancements have been made in video-language tasks such as cross-modal retrieval, video captioning, and video category classification.
GPT 토크나이저의 이해 / Understanding GPT Tokenizers (8 minute read)
이 문서에서는 대규모 언어 모델에서 예측을 위해 텍스트를 토큰으로 변환하는 데 사용되는 GPT 토크나이저에 대해 설명합니다. 사용자가 텍스트를 토큰으로 또는 그 반대로 변환하고 전체 토큰 테이블에 대해 검색을 실행할 수 있는 관찰 가능한 노트북 도구를 소개합니다.
The article discusses GPT tokenizers, which are used by large language models to convert text into tokens for prediction. It presents an Observable notebook tool that allows users to convert text to tokens and vice versa, as well as to run searches against the full token table.
엔지니어링 및 리소스 관련 소식 / Engineering & Resources
비디오 팬옵틱 세그멘테이션을 위한 1위 솔루션 / 1st Place Solution for Video Panoptic Segmentation (5 minute read)
이 논문에서는 비디오 편집 및 자율주행차와 같은 분야에서 중요한 기술인 비디오에서 움직이는 물체와 정지된 물체를 모두 분리하고 추적하는 독특한 접근 방식을 살펴봅니다. 이 접근 방식은 성공의 척도인 높은 VPQ 점수로 권위있는 대회에서 1등을 차지했습니다.
This report explores a unique approach to separating and tracking both moving and stationary objects in videos - a technique crucial for areas like video editing and self-driving cars. The approach earned first place in a prestigious competition with a high VPQ score, a measure of success.
Git-Theta: ML 모델의 공동 개발을 위한 Git 확장 / Git-Theta: A Git Extension for Collaborative Development of ML Models (18 minute read)
Git-Theta는 머신 러닝 모델의 변경 사항 및 업데이트를 추적하기 위해 특별히 설계된 널리 사용되는 버전 관리 소프트웨어인 Git의 확장 기능입니다. 커뮤니케이션이 효율적인 업데이트, 자동 모델 병합, 모델 버전에 대한 자세한 보고를 가능하게 함으로써 Git-Theta는 오픈 소스 소프트웨어 개발과 마찬가지로 머신 러닝 모델을 지속적으로 협업하여 개선할 수 있는 길을 열어줍니다.
Git-Theta is an extension to the widely used version control software, Git, designed specifically for tracking changes and updates in machine learning models. By enabling communication-efficient updates, automatic model merges, and detailed reporting of model versions, Git-Theta paves the way for collaborative, ongoing improvement of machine learning models, much like open-source software development.
ChatGPT는 정말 재밌을까? 농담을 통한 AI 유머에 관한 연구 / Is ChatGPT Really Funny? A Study on AI Humor Through Jokes (16 minute read)
저자들은 OpenAI의 정교한 언어 모델인 ChatGPT가 유머를 효과적으로 이해하고 재현할 수 있는지 탐구했습니다. 일련의 실험을 통해 ChatGPT가 유효한 농담을 설명할 수 있고 익숙한 농담을 반복하는 경우가 많지만, 새로운 농담을 만들고 유머 요소를 식별하는 데는 어려움을 겪는다는 사실을 발견했습니다.
Authors have explored if ChatGPT, a sophisticated language model by OpenAI, can understand and reproduce humor effectively. Through a series of experiments, they found that while ChatGPT can explain valid jokes and often repeats familiar ones, it struggles with creating new jokes and identifying humorous elements.
그 외 소식 / Miscellaneous
Adobe, Firefly의 모든 법적 비용을 부담할 것 / Adobe Will Cover Any Legal Bills From Firefly (3 minute read)
Adobe는 크리에이터의 저작권이 있는 이미지를 존중하는 Firefly의 기능에 대한 확신을 가지고 있으며, 이 툴로 생성한 이미지에 대한 저작권 침해로 소송을 당할 경우 법적으로 보상할 것이라고 합니다.
Adobe is so confident in Firefly’s ability to respect creators’ copyrighted images that it’ll legally compensate businesses if they’re sued for copyright infringement over any images its tool creates.
과학자들이 ChatGPT 콘텐츠의 99% 이상의 식별이 가능하다고 주장 / Scientist Claims Over A 99% ID Rate Of ChatGPT Content (3 minute read)
한 학자가 머신러닝 알고리즘을 훈련시켜 ChatGPT에서 생성된 과학 논문을 감지했으며, 이 소프트웨어의 정확도가 99% 이상이라고 주장했습니다.
Academics have apparently trained a machine learning algorithm to detect scientific papers generated by ChatGPT and claim the software has over 99 percent accuracy.
AI는 나중에 배워도 됩니다 / You can learn AI Later (2 minute read)
요즘의 'Everything with AI' 열풍은 웹이나 모바일이 히트했을 때의 느낌입니다. "뒤쳐지기 전에 HTML을 빨리 배우세요!" "귀사는 앱 전략이 있나요?!" AI도 마찬가지이며 우리는 아직 시끌시끌한 시기에 있습니다.
Everything with AI feels like when the web or mobile hit. “Learn HTML fast before you’re left behind!” “Does your company have an app strategy?!” Same is true with AI and we’re still in the noisy phase.
더 읽어보기 / Quick Links
협박범들이 피해자를 갈취하기 위해 딥페이크 누드를 사용 중 / Blackmailers Are Using Deepfaked Nudes To Extort Victims (1 minute read)
FBI는 AI 편집 도구의 도움으로 제작된 가짜 누드를 이용한 갈취 사기가 "증가"하고 있다는 경고를 발표했습니다.
The FBI has issued an advisory warning of an “uptick” in extortion schemes involving fake nudes created with the help of AI editing tools.
TeamGPT (Product)
복잡한 작업을 완료하기 위해 서로 다른 AI 간의 협업 모델을 제공하는 고급 AI 솔루션입니다. 뿐만 아니라 스마트한 프롬프트 제안, 행동 기반 응답 템플릿, 개인화된 AI 인사이트도 제공합니다.
An advanced AI solution that offers collaborative models between different AI’s to complete complex tasks. Not only that, it also provides smart prompt suggestions, action-based response templates, and personalized AI insights.
HearHear (Product)
회의 내용을 듣고 실행 가능한 인사이트를 제공하는 AI 봇입니다.
An AI bot that listens in on your meetings and produces actionable insights.
Supabase Vector (Product Launch)
Supabase Vector는 모든 AI 애플리케이션을 강화하는 AI 툴킷입니다. 사용자 데이터와 함께 벡터 임베딩을 대규모로 저장할 수 있습니다. 모든 언어, 스택 또는 프로그래밍 환경에서 작동합니다.
Supabase Vector is an AI toolkit to power any AI application. Store vector embeddings at scale alongside user data. Works with any language, stack, or programming environment.