파이토치 한국 사용자 모임에서는 TLDR 뉴스레터 의 승인을 받아 AI 소식을 DeepL로 번역 하여 전합니다.
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요!
주요 뉴스 & 신규 출시 소식 / Headlines & Launches
아마존, Anthropic에 최대 40억 달러 투자 / Amazon invests up to $4B in Anthropic (3 minute read)
아마존은 Anthropic에 최대 40억 달러를 투자하고 있으며, IP 및 컴퓨팅 옵션에 대한 일련의 거래를 테이블에 올려놓고 있습니다. Anthropic의 안전 거버넌스는 변함없이 유지됩니다. anthropic amazon
Amazon is investing up to $4B in Anthropic with a set of trades in IP and compute options on the table. Anthropic’s safety governance remains unchanged.
이제 보고, 듣고, 말할 수 있는 ChatGPT / ChatGPT can see, hear, and speak now (8 minute read)
ChatGPT에 여러 가지 기능이 추가되어 업그레이드됩니다. 곧 모델과 대화하고 모델이 응답하도록 할 수 있게 될 것입니다. 또한 사용자는 이미지를 업로드하고 이에 대해 질문할 수 있습니다. chatgpt openai
ChatGPT is getting an upgrade in modality with a number of additions. You will soon be able to speak to the model and have it speak back. Users will also be able to upload images and ask questions about them.
(더 읽어보기 [GN] ChatGPT는 이제 보고, 듣고, 말할 수 있습니다)
스포티파이가 팟캐스터의 목소리를 복제하고 번역할 예정 / Spotify Is Going To Clone And Translate Podcasters’ Voices (1 minute read)
Spotify는 원래 팟캐스터의 목소리를 사용하여 다른 언어로 팟캐스트를 재생할 수 있는 AI 기반 음성 번역 기능을 도입했습니다. 이 기술은 트랜스크립션과 음성 복제를 위해 OpenAI의 Whisper를 사용하며, 팟캐스터의 고유한 목소리를 유지하면서 번역할 수 있습니다. spotify whisper
Spotify has introduced an AI-powered voice translation feature that can reproduce podcasts in other languages using the original podcaster's voice. The technology relies on OpenAI's Whisper for transcription and likely for voice replication, allowing translations to maintain the podcaster's unique voice.
연구 & 혁신 관련 소식 / Research & Innovation
DeepEval (GitHub Repo)
DeepEval은 LLM 파이프라인에서 오프라인 평가를 실행할 수 있는 파이토닉 방식을 제공하여 프로덕션에 편안하게 출시할 수 있도록 지원합니다.
DeepEval provides a Pythonic way to run offline evaluations on your LLM pipelines so you can launch comfortably into production.
오딘 / Odin (GitHub Repo)
GPT-4로 데이터에서 지식 그래프를 생성하세요. knowledge-graph
Generate knowledge graphs from your data with GPT-4.
VPP: 패시브 카메라로 깊이 추정 향상하기 / Enhancing Depth Estimation with Passive Cameras (6 minute read)
이 연구에서는 물리적 패턴 프로젝터 없이 패시브 카메라에서 액티브 스테레오를 시뮬레이션하는 방법을 소개합니다. 연구진은 외부 센서의 깊이 데이터를 사용하여 패턴을 가상으로 오버레이함으로써 기존 설정의 한계를 극복합니다. 이 접근 방식은 다양한 데이터 세트에서 스테레오 알고리즘과 딥러닝 네트워크를 모두 향상시킵니다. gedepth
This study introduces a method that simulates active stereo in passive cameras without a physical pattern projector. By virtually overlaying patterns using depth data from external sensors, the researchers overcome the limitations of traditional setups. This approach enhances both stereo algorithms and deep learning networks on various datasets.
엔지니어링 및 리소스 관련 소식 / Engineering & Resources
NeuralLabeling: 3D 도구를 사용한 고급 씬 주석 / Advanced Scene Annotation Using 3D Tools (2 minute read)
NeuralLabeling은 3D 기술을 사용하여 장면에 세부적인 주석을 추가할 수 있는 툴입니다.
NeuralLabeling is a tool for detailed scene annotations using 3D techniques.
PVLFF: 텍스트 설명을 사용하여 3D 씬을 이해하고 레이블을 지정하는 모델 / A Model That Understands and Labels 3D Scenes Using Text Descriptions (12 minute read)
연구원들은 3D 장면을 보고 그 안에 무엇이 있는지 식별할 수 있을 뿐만 아니라 텍스트 설명을 사용하여 동일한 물체의 여러 인스턴스를 구별할 수 있는 PVLFF라는 새로운 모델을 만들었습니다.
Researchers have created a new model called PVLFF that can look at 3D scenes and not only identify what's in them, but also distinguish between different instances of the same object—all by using text descriptions.
LayoutLM: 비즈니스 문서 가독성 향상 / Improving Business Document Reading (24 minute read)
LayoutLM은 비즈니스 문서를 잘 읽는 모델입니다. 복잡한 레이아웃을 이해하는 데 도움이 되는 훈련과 숫자 값을 정확하게 파악하는 훈련 등 두 가지 새로운 훈련을 통해 더욱 똑똑해졌습니다.
LayoutLM is a model that is good at reading business documents. It was made even smarter with two new training exercises—one to help it understand complicated layouts and another to get numeric values right.
그 외 소식 / Miscellaneous
쇼트웨이브, 구글의 듀엣 AI에 대항하는 AI 이메일 비서 출시 / Shortwave launches AI email assistant to rival Google’s Duet AI (5 minute read)
쇼트웨이브는 전 세계에서 가장 뛰어난 이메일용 AI 어시스턴트를 출시했다고 주장합니다. 특히 이 어시스턴트는 임베딩 기반 검색을 사용하여 전체 이메일 기록을 검색할 수 있으므로 특정 이메일뿐만 아니라 사용자가 주고받은 모든 이메일에 대한 질문에 답할 수 있습니다.
Shortwave claims to have launched the most capable AI assistant for email on the planet. Notably, its assistant has the ability to search your entire email history using embedding-based search, so it can answer questions about anything you've sent or received, not just specific emails.
LLM-UX: 2027년의 언어 모델 UX / Language Model UXes in 2027 (13 minute read)
이 글에서는 중기적인 미래에 대규모 언어 모델 기반 소프트웨어가 어떤 모습일지 살펴봅니다. LLM은 우리가 컴퓨터와 상호작용하는 방식을 크게 변화시킬 것입니다. 현재 기술 상태는 초보적인 수준이며, 제너레이티브 AI가 지난 수십 년 동안 도입된 다른 UX 혁신을 대체할 수 없다는 것이 점점 더 분명해지고 있습니다. LLM UX는 보다 관련성 높은 응답을 제공하기 위해 과거의 상호작용을 기억하도록 진화할 가능성이 높습니다.
This article explores what large language model-powered software might look like in the medium-term future. LLMs are going to significantly shift how we interact with computers. The current state of the technology seems rudimentary and it's increasingly clear that generative AI can't quite replace the other UX innovations that have been introduced over the last several decades. LLM UXes will likely evolve to have a memory of past interactions in order to provide more relevant responses.
한 소년은 만성 통증으로 3년간 17명의 의사를 만났습니다. ChatGPT가 진단을 찾아냈습니다 / A boy saw 17 doctors over 3 years for chronic pain. ChatGPT found the diagnosis (14 minute read)
3년 동안 17명의 의사를 만났던 한 어머니는 아들의 당혹스러운 증상을 진단하기 위해 ChatGPT를 사용했습니다. 이 AI 플랫폼은 척추 이분증과 관련된 질환인 테더 코드 증후군을 제안했습니다. ChatGPT의 유용성은 입증되었지만, 전문가들은 의료 분야에서 AI의 잠재적 위험과 한계를 지적하며 주의를 촉구하고 있습니다.
After three years and 17 doctors, a mother used ChatGPT to aid in diagnosing her son's perplexing symptoms. The AI platform suggested tethered cord syndrome, a condition associated with spina bifida. While ChatGPT proved valuable, experts urge caution, noting AI's potential risks and limitations in medical applications.
더 읽어보기 / Quick Links
캡슐 / Capsule (Product)
콘텐츠 및 마케팅 팀을 위한 AI 기반 동영상 편집기입니다.
The AI-powered video editor for content and marketing teams.
FireCut AI(제품 출시) / FireCut AI (Product Launch)
FireCut(Adobe Premiere Pro용)은 시간이 많이 걸리는 작업을 자동화하여 편집 속도를 높여주는 AI 동영상 편집기입니다.
FireCut (for Adobe Premiere Pro) is an AI video editor that speeds up your editing by automating time-consuming tasks.
Autoflows: 자연어로 워크플로를 구축할 수 있는 새로운 사전 고려 도구 / New Forethought tool lets you build workflows with natural language (2 minute read)
포어씽크는 자연어 프롬프트에 기반한 AI 기반 작업인 오토플로우를 출시했습니다. 기존 워크플로우와 달리 자동 흐름은 SupportGPT 및 OpenAI 모델을 사용하여 해결 속도를 향상시킵니다.
Forethought has launched Autoflows, AI-driven tasks based on natural language prompts. Unlike traditional workflows, Autoflows enhances resolution rates using SupportGPT and OpenAI models.