[TLDR] 오늘의 AI 뉴스, 2023-08-11: ChatGPT 사용자 지정 지침 🤖, 뉴스 매체 및 AI 학습 데이터 🗞️, In-context 학습으로 Llama-2 향상 🦙

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :star_struck:

더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:

TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

스탠포드 에이전트 코드 오픈소스 공개! / Stanford Agents code open sourced! (Github Repo)

몇 달 전 스탠퍼드의 한 연구 그룹이 실제 사람들이 살고 있는 완전 시뮬레이션 마을을 만들어 화제를 모았습니다. 이 코드는 현재 오픈소스로 공개되어 있습니다. 가장 흥미로운 부분은 각 사람과 전체 시스템이 gpt-3.5-turbo와 같은 비상태 보존 API를 사용하여 작동하도록 엔지니어링한 부분입니다.

A research group at Stanford created a splash a few months ago with their fully simulated village with realistic people living lives. That code is now open sourced. The most interesting piece is likely how they prompt engineered each person and the overall system to work with a non-state preserving API like gpt-3.5-turbo.

ChatGPT, '사용자 지정 지침' 기능을 무료 사용자로 확장 / ChatGPT Expands Its ‘Custom Instructions’ Feature To Free Users (1 minute read)

OpenAI는 사용자가 ChatGPT의 응답 방식을 더 잘 제어할 수 있는 방법인 사용자 지정 지침을 서비스의 무료 티어 사용자를 포함한 모든 사용자로 확대한다고 발표했습니다.

OpenAI announced that it’s expanding custom instructions — a way to give users more control over how ChatGPT responds — to all users, including those on the free tier of the service.

chatgpt

뉴스 매체, AI 학습 데이터에 대한 새로운 규칙 요구 / News outlets demand new rules for AI training data (14 minute read)

여러 언론 기관에서 생성형 AI 모델 학습에 사용되는 데이터의 저작권을 보호하는 규칙을 요구하고 있습니다. 이들은 전 세계 의원들에게 학습 데이터 세트의 투명성과 학습에 데이터를 사용하기 전에 권리 소유자의 동의를 요구하는 규정을 고려할 것을 촉구하는 공개 서한에 서명했습니다. 이 서한은 또한 미디어 회사가 AI 모델 운영자와 협상하고 AI가 생성한 콘텐츠를 식별할 수 있도록 허용하고, AI 회사가 서비스에서 편견과 잘못된 정보를 제거하도록 의무화할 것을 요청합니다.

Several media organizations have called for rules protecting copyright in data used to train generative AI models. They have signed an open letter urging lawmakers around the globe to consider regulations that require transparency in training datasets and the consent of rights holders before using data for training. The letter also requests allowing media companies to negotiate with AI model operators and identify AI-generated content, and mandates that AI companies eliminate bias and misinformation in their services.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

MultitaskVLFM: 비전 언어 모델의 정밀도 향상 / Boosting the Precision of Vision-Language Models (GitHub Repo)

이 저장소에서는 CLIP과 같은 비전 언어 모델의 성능을 향상시키는 멀티태스킹 전략을 소개합니다. 특히 세부 속성 감지 및 이미지 내 위치 파악과 같은 작업에서 유용합니다.

This repository introduces a multitasking strategy that improves the performance of vision-language models like CLIP specifically in tasks like detailed attribute detection and pinpointing locations within images.

vision-language

U-CREAT: 법률 리서치를 더 빠르고 정확하게 만들기 / Making Legal Research Faster and More Accurate (GitHub Repo)

이 저장소에서는 이벤트 추출을 사용하여 관련 과거 법률 사례를 더 빠르고 정확하게 찾을 수 있는 U-CREAT라는 새로운 도구를 소개합니다. 또한 방대한 인도 법률 판례 모음인 IL-PCR 코퍼스를 소개하고, U-CREAT가 인도 법률 시스템뿐만 아니라 캐나다 시스템에서도 탁월한 성능을 발휘하는 방법을 보여줍니다.

This repository introduces a new tool called U-CREAT, which uses event extraction to find relevant past legal cases faster and more accurately. It also presents the IL-PCR corpus, a vast collection of Indian legal cases, and shows how U-CREAT performs excellently not only in the Indian legal system but also in the Canadian system.

legal-dataset

Chidori: 신뢰할 수 있는 AI 에이전트 구축 / Chidori, build reliable AI agents (GitHub Repo)

Chidori(치도리)는 AI 에이전트 구축을 위한 리액티브 런타임입니다. 반응형, 관찰 가능, 견고한 AI 에이전트를 구축하기 위한 프레임워크를 제공합니다. Node.js, Python, Rust로 에이전트 구축을 지원합니다.

Chidori is a reactive runtime for building AI agents. It provides a framework for building AI agents that are reactive, observable, and robust. It supports building agents with Node.js, Python, and Rust.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

In-Context 학습을 통한 라마-2 모델의 성능 향상 / Enhancing Llama-2 Model's Performance Through In-Context Learning (8 minute read)

이 논문에서는 채팅 스타일의 프롬프트에서 9개의 데모 예제를 검색하여 사전 학습된 Llama-2 언어 모델을 사용한 상황 내 학습을 연구했습니다. 모델의 가중치를 변경하지 않은 이 방법은 텍스트-다빈치-003 모델에 비해 승률이 7배 증가하여 정렬 미세 조정을 거친 모델과 동등한 수준으로 향상되었습니다.

This paper studied in-context learning with the pretrained Llama-2 language model by retrieving 9 demonstration examples during chat-style prompts. The method, which didn't alter the model's weights, resulted in a 7x win-rate increase compared to the text-davinci-003 model, making it on par with models that underwent alignment fine-tuning.

llama llama2

V-DETR: DETR을 사용한 3D 객체 감지 개선 / Improving 3D Object Detection Using DETR (14 minute read)

현재의 3D 물체 감지기는 데이터를 잘못 해석하여 멀리 떨어진 지점에 초점을 맞추는 경우가 많습니다. 이 백서의 저자는 3D 버텍스 상대 위치 인코딩이라는 새로운 방법을 개발하여 감지기의 주의를 대상 물체에 가까운 지점으로 향하게 합니다.

Current 3D object detectors often misinterpret data, causing them to focus on distant points. The authors of this paper have developed a new method, 3D Vertex Relative Position Encoding, that directs the detector's attention to points close to the target objects.

detr

False-Negative 제거 전략으로 이미지-텍스트 매칭 개선 / Improving Image-Text Matching with the False Negative Elimination Strategy (15 minute read)

기존의 이미지-텍스트 매칭 모델은 종종 매우 유사하지만 일치하지 않는 샘플을 잘못 사용하는데, 이를 오탐이라고 하며 학습 과정을 잘못 안내할 수 있습니다. 이 논문에서는 오탐일 확률을 평가하여 오탐을 신중하게 선별하는 새로운 방법인 오탐 제거 전략을 소개합니다.

Traditional image-text matching models often mistakenly use highly similar but not matching samples, known as false negatives, which can misguide the learning process. This paper introduces the False Negative Elimination strategy, a novel method that carefully selects negatives by assessing their probability of being false negatives.

:gift: 그 외 소식 / Miscellaneous

소프트뱅크, 합작회사 심보틱 지분 인수 / SoftBank Ups Stake In Symbotic in Joint Venture Deal (3 minute read)

소프트뱅크 그룹은 심보틱과 총 1억 달러를 투자해 AI 기반 물류창고 합작회사 '그린박스 시스템즈(GreenBox Systems LLC)'를 설립한다. 또한 소프트뱅크는 75억 달러 규모의 심보틱의 물류창고용 AI 시스템을 구매할 예정이다. 이러한 움직임은 로봇 공학 및 AI 기반 공급망 솔루션에 대한 SoftBank의 노력을 강화합니다.

SoftBank Group is establishing an AI-based warehousing joint venture with Symbotic Inc. called GreenBox Systems LLC with a combined investment of $100 million. SoftBank will also purchase $7.5 billion of Symbotic's AI systems for warehousing. This move strengthens SoftBank's commitment to robotics and AI-driven supply chain solutions.

Pinecone의 시작부터 하루 10,000명 가입까지의 여정 / Pinecone’s journey from seed to 10,000 sign-ups per day (9 minute read)

최근 제품 주도 성장(PLG)에 대해 많이 포스팅했습니다. 이 글은 PLG에 성공한 기업의 또 다른 좋은 예입니다. 핵심은 누구를 위한 제품을 만들 것인지 신중하게 생각하고, 정의된 페르소나에 집중한 다음, 그들이 제품을 사용해 볼 수 있는 경로를 최대한 원활하게 만들어야 한다는 것입니다. Pinecone의 제품에는 전통적인 B2B 마케팅 플레이북이 적용되지 않았습니다.

We’ve posted a lot about product-led growth (PLG) lately. This is another great example of a company nailing PLG. The key takeaways include being really thoughtful about who you’re building the product for, focusing on a defined persona, and then making their pathway to try your product as frictionless as possible. The traditional B2B marketing playbook didn’t land for Pinecone’s product.

vector-database

메타, 단백질 폴딩 팀 해체 / Meta disbands protein folding team (4 minute read)

Meta는 업계에서 가장 많은 단백질을 접는 팀 중 하나였습니다. 그러나 AI 시스템의 상용화를 추진하면서 팀은 해체되었습니다. 이는 대형 연구소의 논문 생산량 감소와 함께 생성형 AI의 성공에 따른 슬픈 부작용입니다.

Meta had one of the most prolific protein folding teams in the industry. However, the team was disbanded in the push towards the commercialization of AI systems. This, along with large labs reducing their publication output, is a sad side-effect of generative AI’s success.

:zap: 더 읽어보기 / Quick Links

Llama-2-Onnx (GitHub Repo)

메타의 라마 2 모델에 최적화된 버전입니다.

An optimized version of the Llama 2 model from Meta.

llama llama2

impel: Mac용 프롬프트 없는 AI 컴패니언 / Introducing impel, a prompt-free AI companion for your Mac (Product)

impel은 화면의 맥락을 이해하고 프롬프트가 필요 없으며 제안, 정보 및 작업을 자동으로 표시하는 Mac용 상시 작동하는 AI 동반자입니다.

impel is an always-on AI companion for your Mac that understands the context of your screen, doesn’t need any prompting, and surfaces suggestions, information, and actions automatically.

Cedalio: 검증 및 감사가 가능한 데이터베이스 / Cedalio, a database that is verifiable and auditable by default (Product)

세달리오는 기본적으로 감사 가능한 정보로 앱을 구축할 수 있도록 도와주는 플랫폼입니다. 애플리케이션에 사용된 데이터는 출처까지 추적할 수 있습니다.

Cedalio is a platform that helps you build apps with information that is auditable by default. Data used in your application can be traced back to its origin.