파이토치 한국 사용자 모임에서는 TLDR 뉴스레터 의 승인을 받아 AI 소식을 DeepL로 번역 하여 전합니다.
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요!
주요 뉴스 & 신규 출시 소식 / Headlines & Launches
NVIDIA, LLM을 위한 더 빠른 추론 엔진 TensorRT-LLM 출시 / NVIDIA launches a faster inference engine for LLMs (6 minute read)
현재의 AI 경쟁이 시작될 당시에는 훈련 비용이 추론의 주를 이루었습니다. 더 많은 사람들이 언어 모델을 프로덕션에 배포함에 따라 추론 비용은 빠르게 증가할 수 있습니다. TensorRT는 오랫동안 속도를 위해 사용되어 왔습니다. 이제 H100의 언어 모델 전용 버전이 출시되었습니다.
Training costs dominated inference when the current AI race began. Inference costs can quickly balloon as more people deploy language models to production. TensorRT has long been the go-to for speed. A version specifically for language models on H100s is now available.
9월까지 정부 A100 기반 슈퍼컴퓨터 절반 할인 / Government A100 based supercomputer half off through September (2 minute read)
NERSC는 GPU 기반 워크로드를 위한 슈퍼컴퓨터에 대해 한시적으로 할인을 제공합니다.
The NERSC is offering a limited-time discount on its supercomputer for GPU-based workloads.
추론하고 코딩할 수 있는 AI 시스템 구축을 위해 2억 달러 모금에 나선 Imbue / Imbue raises $200M to build AI systems that can reason and code (6 minute read)
이전에 제너럴 인텔리전트(Generally Intelligent)로 알려진 임뷰는 2억 달러의 시리즈 B 펀딩을 유치하여 10억 달러 이상의 기업가치를 달성했습니다. 이번 투자금은 추론과 코딩이 가능한 AI 시스템 개발을 가속화하는 데 사용될 예정입니다. 임뷰는 사용자의 목표를 이해하고 자율적으로 행동하는 AI 에이전트를 비전으로 사용자의 주체성, 자유, 존엄성을 강화하는 진정한 개인용 컴퓨터를 만드는 것을 사명으로 삼고 있습니다.
Imbue, formerly known as Generally Intelligent, has secured $200M in Series B funding, achieving a valuation of over $1 billion. The funding aims to accelerate the development of AI systems capable of reasoning and coding. Imbue's mission is to produce truly personal computers that amplify user agency, freedom, and dignity, with a vision for AI agents that understand and autonomously act upon user goals.
연구 & 혁신 관련 소식 / Research & Innovation
(광고) 결함 없는 엔드투엔드 테스트 커버리지: 인간을 위한, 인간에 의한, 인간을 위한 / End-to-end test coverage with zero flakes. For humans, by humans (Sponsor)
AI로 4개월 내에 80%의 자동화된 테스트 커버리지를 달성할 수 있을까요? 언젠가는 가능할지도 모르죠. 그때까지는 QA Wolf. 전체 테스트 스위트를 오픈 소스 Playwright로 작성하고(코드 소유권 보유!) 모든 배포에서 100% 병렬로 실행할 수 있는 인프라를 제공합니다(무제한 테스트 실행 포함!). 유지 관리도? 네, 그것도 가능합니다(풀 리팩터까지!). Cohere와 같은 AI 회사에서도 사용하고 있습니다! 마술 같지만 QA Wolf입니다
Can AI get you to 80% automated test coverage within 4 months? Maybe one day. Until then, there’s
QA Wolf. They’ll write your entire test suite in open-source Playwright (you own the code!) AND provide the infra to run it in 100% parallel on every deploy (unlimited test runs included!). Maintenance? Yep, that’s on them too (even full refactors!). Even AI companies like Cohere use them! It’s like magic but it’s QA Wolf
XenonJs: 컴포저블 AI 기반 에코시스템 / XenonJs: composable AI-powered ecosystem (GitHub Repo)
코드가 필요 없는 환경에서 빠르게 성장하는 XenonJs의 컴포넌트 에코시스템을 활용하여 제작하기 쉽고, 오래 지속되며, 혁신적이고, 사용자 지정 가능한 경험을 만들고 공유하세요. 자체 컴포넌트 또는 모델을 에코시스템에 원활하게 추가할 수 있습니다.
Create and share easy-to-make, built-to-last, innovative, and customizable experiences by leveraging XenonJs’ rapidly growing ecosystem of components in a no-code environment. Seamlessly add your own components or models to the ecosystem.
Web AI로 브라우저에서 최신 딥 러닝 모델 실행 / Run modern deep learning models in the browser with Web AI (GitHub Repo)
기술이 성숙해짐에 따라 웹어셈블리에 대한 과대 광고는 사라졌습니다. WebAssembly는 이제 브라우저 기반 모델 배포를 비롯한 많은 프로덕션 시나리오에서 사용할 수 있을 만큼 충분히 우수합니다.
As the technology has matured, WebAssembly hype has died down. WebAssembly is now good enough to be used in many production scenarios, including browser-based model deployment.
SAM-Med2D: 세그먼트 애니씽 모델로 개선된 의료 이미지 세분화 / Improved Medical Image Segmentation with Segment Anything Model (GitHub Repo)
세그먼트 애니씽 모델(SAM)은 일반 이미지에는 잘 작동하지만 의료 이미지에는 잘 작동하지 않습니다. SAM-Med2D는 다양한 종류의 입력 정보가 포함된 방대한 의료 이미지 세트로 SAM을 훈련하여 만들어졌습니다. 의료 이미지에서 훨씬 더 나은 성능을 발휘합니다.
The Segment Anything Model (SAM) works great for regular images, but not so well for medical ones. SAM-Med2D was created by training SAM on a huge set of medical images with various kinds of input information. It performs much better on medical images.
엔지니어링 및 리소스 관련 소식 / Engineering & Resources
3D 공간에서 농구공 찾기 / Finding the Basketball in 3D Space (8 minute read)
이 연구의 저자는 단 한 장의 사진으로 3D 공간에서 농구공의 위치를 정확하게 파악하는 새로운 방법을 개발했으며, 이는 스포츠 분석 및 로봇 공학 분야에서 큰 의미가 있습니다.
The authors of this study developed a new way to accurately figure out where a basketball is in 3D space using just one photo, which is a big deal for things like sports analytics and robotics.
Chupa: 2D 확산 확률 모델을 사용하여 3D 옷을 입은 사람 조각하기 / Carving 3D Clothed Humans using 2D Diffusion Probabilistic Models (3 minute read)
확산 모델을 사용하여 거리 및 모양 정보가 포함된 2D 노멀 맵을 생성한 다음 3D 재구성 알고리즘을 사용하면 기본 신체 모델을 사용하여 사실적인 3D 인간 아바타를 생성할 수 있습니다. 이는 합성 아바타와 캐릭터 생성에 유용합니다.
If you use a diffusion model to generate 2D normal maps, which contain distance and shape information, and then use a 3D reconstruction algorithm, you can generate realistic 3D human avatars using an underlying body model. This is useful for synthetic avatars and character creation.
ChatGPT가 다음 좋아하는 영화나 책을 찾는 데 도움이 될까요? / Can ChatGPT Help You Find Your Next Favorite Movie or Book? (45 minute read)
이 연구는 ChatGPT가 사용자가 좋아할 만한 영화나 책을 얼마나 잘 추천하는지 살펴봅니다.
This study looks at how well ChatGPT can suggest movies or books you might like.
그 외 소식 / Miscellaneous
OpenAI가 진정으로 원하는 것 / What OpenAI Really Wants (21 minute read)
OpenAI와 CEO 샘 알트먼은 인공 일반 지능(AGI)을 안전하게 개발하는 것을 목표로 하지만, 자금과 제품을 추구하면서 회사 문화에 변화를 가져왔습니다. ChatGPT를 출시하면서 대중은 AI에 익숙해졌습니다. 비평가들은 OpenAI의 상업적 초점이 AI 위험을 완화하는 데 방해가 된다고 말하지만, OpenAI는 자사의 사명은 변함이 없다고 주장합니다.
OpenAI and CEO Sam Altman aim to develop artificial general intelligence (AGI) safely, but the pursuit of funding and products has shifted the company’s culture. Releasing ChatGPT acclimated the public to AI. Critics say that OpenAI’s commercial focus distracts from mitigating AI risks, but OpenAI insists that its mission remains unchanged.
그레이록의 제품 주도형 AI / Product-Led AI from Greylock (11 minute read)
투자자들은 NVIDIA와 같은 AI 구현 업체를 지원하는 것에서 일과 삶을 재정의하는 혁신적인 AI 퍼스트 제품을 개발하는 창업자를 지원하는 것으로 초점을 전환하고 있습니다. 세 가지 주요 AI 우선 기회에는 인간 중심 콘텐츠 제작에서 알고리즘 콘텐츠 제작으로 전환하는 AI 우선 네트워크 및 마켓플레이스, AI가 주요 기능이 되는 엔터프라이즈 소프트웨어 범주 재정의, 특히 자산 관리와 같은 영역에서 서비스를 보강하는 AI '코파일럿'이 포함됩니다. 이러한 잠재력은 소프트웨어를 넘어 방대한 서비스 시장으로 확장되고 있습니다.
Investors are shifting focus from backing AI enablers like NVIDIA to supporting founders building transformative, AI-first products that redefine work and life. Three major AI-first opportunities include AI-first networks and marketplaces transitioning from human-driven to algorithmic content creation, redefining enterprise software categories where AI becomes the main feature, and AI "co-pilot" augmenting services, especially in areas like wealth management. The potential extends beyond software, tapping into vast service markets.
메타가 일부 개인 데이터를 사용하여 생성형 AI 모델을 학습하는 것을 중지하는 방법 / How to stop Meta from using some of your personal data to train generative AI models (5 minute read)
메타는 Facebook 사용자가 생성형 AI 모델 학습에 사용된 개인 데이터를 삭제할 수 있는 옵트아웃 도구를 도입했습니다. '생성형 AI 데이터 주체 권리' 양식은 공개적으로 사용 가능한 데이터 또는 라이선스 소스를 포함한 제3자 정보에 중점을 둡니다. 이러한 조치는 데이터 프라이버시에 대한 우려가 커지면서 국제 기관들이 기술 기업들에게 글로벌 데이터 보호 및 개인정보 보호법을 준수할 것을 촉구하는 가운데 나온 것입니다.
Meta has introduced an opt-out tool allowing Facebook users to delete personal data used in training generative AI models. The "Generative AI Data Subject Rights" form focuses on third-party information, which includes publicly available data or licensed sources. The move comes as data privacy concerns rise, with international agencies urging tech companies to adhere to global data protection and privacy laws.
더 읽어보기 / Quick Links
ChatGPT는 물을 많이 사용합니다 / ChatGPT Uses A Lot Of Water (3 minute read)
ChatGPT는 5~50개의 프롬프트 또는 질문을 연속해서 받을 때마다 최대 500밀리리터의 물(16온스 생수병에 담긴 물과 같은 양)을 사용하는 것으로 추정됩니다.
It is estimated that ChatGPT uses up to 500 milliliters of water (about equal to what’s in a 16-ounce bottle) every time it is asked a series of between 5 to 50 prompts or questions.
Microsoft와 페이지가 세계 최대 규모의 암 감지 AI 모델을 구축하다 / Microsoft And Paige Are Building The World’s Largest Cancer Detecting AI Model (3 minute read)
Microsoft는 디지털 병리학 제공업체인 페이지와 협력하여 암을 식별하는 세계 최대의 이미지 기반 인공 지능 모델을 구축합니다.
Microsoft is teaming up with digital pathology provider Paige to build the world’s largest image-based artificial intelligence model for identifying cancer.
리프레이즈 AI / Rephrase AI (Product)
동영상 제작의 복잡성을 없애주는 텍스트-비디오 생성 플랫폼으로, 디지털 아바타로 몇 분 만에 전문가 수준의 동영상을 제작할 수 있습니다.
A text-to-video generation platform that eliminates the complexity of video production, enabling you to create professional-looking videos with a digital avatar in minutes.