파이토치 한국 사용자 모임에서는 TLDR 뉴스레터 의 승인을 받아 AI 소식을 DeepL로 번역 하여 전합니다.
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요!
주요 뉴스 & 신규 출시 소식 / Headlines & Launches
Secoda, 데이터 카탈로그 플랫폼 확장을 위해 1,400만 달러 확보 / Secoda secures $14M to expand its data cataloging platform (5 minute read)
AI 기반 데이터 검색 및 카탈로그 플랫폼 스타트업인 Secoda가 Craft Ventures가 주도하는 1,400만 달러의 투자를 유치했습니다. 온타리오에 본사를 둔 이 회사는 기업 데이터를 Google 검색처럼 원활하게 찾고 이해할 수 있도록 하는 것을 목표로 합니다. Secoda는 전년 대비 250%의 매출 성장을 기록했으며, Remitly와 Y Combinator와 같은 주목할 만한 고객을 유치했습니다.
Secoda, an AI-driven data search and cataloging platform startup, has secured $14 million in funding led by Craft Ventures. The Ontario-based company aims to make finding and understanding company data as seamless as a Google search. Secoda has seen a 250% YoY revenue growth, attracting notable customers like Remitly and Y Combinator.
메타, 젊은 사용자를 위한 '센스 있는 챗봇' 출시 예정 / Meta Is Bringing Out ‘Sassy Chatbots’ For Younger Users (1 minute read)
메타는 젊은 사용자를 겨냥한 다양한 페르소나를 갖춘 생성형 AI 챗봇인 '젠 AI 페르소나'를 출시할 준비를 하고 있는 것으로 알려졌습니다.
Meta is reportedly preparing to launch "Gen AI Personas," a generative AI chatbot aimed at younger users with various personas designed to engage them.
Bing, 다양한 AI 개선 사항 확보 / Bing To Gain A Number Of AI Improvements (2 minute read)
Microsoft의 Bing은 OpenAI의 새로운 DALLE-E 3 모델, 검색 및 채팅에서 더욱 개인화된 답변, 이미지에 AI가 생성한 것으로 워터마킹하는 도구를 지원합니다.
Microsoft’s Bing is gaining support for OpenAI’s new DALLE-E 3 model, more personalized answers in search and chat, and tools that will watermark images as being AI-generated.
연구 & 혁신 관련 소식 / Research & Innovation
Sidekick (Product)
사이드킥은 터미널과 VSCode를 위한 초인적인 스타일의 AI 프로그래밍 툴킷입니다.
Sidekick is a superhuman-style AI programming toolkit for the terminal and VSCode.
FGFusion 자율주행차를 위해 카메라와 라이다 데이터를 결합하는 더 나은 방법 / A Better Way to Combine Camera and Lidar Data for Self-Driving Cars (GitHub Repo)
이 리포지토리에서는 자율주행차를 위해 카메라와 라이다의 데이터를 세밀하게 결합하는 새로운 방법인 FGFusion을 소개합니다. 높은 수준의 디테일만 사용하는 것이 아니라 큰 그림과 세밀한 디테일을 모두 캡처하여 주변 환경에 대한 보다 정확한 3D 뷰를 생성합니다.
This repository introduces FGFusion, a new method that combines data from cameras and Lidars in a detailed way for self-driving cars. Instead of just using high-level details, it captures both big-picture and fine details to create a more accurate 3D view of the surroundings.
더 빠른 임베딩(주피터 노트북) / Faster embeddings (Jupyter Notebook)
검색은 생성 품질을 개선하는 한 가지 방법입니다. 하지만 쿼리를 삽입하고 검색하는 속도가 느린 경우가 많습니다. 이 노트북에서는 검색 성능을 개선하는 데 도움이 되는 몇 가지 유용한 요령을 보여드립니다.
Retrieval is one way to improve generation quality. However, it is often slow to embed queries and search. This notebook shows some clever tricks to help improve retrieval performance.
엔지니어링 및 리소스 관련 소식 / Engineering & Resources
EmoPP: 자연스러운 텍스트 음성 변환 렌더링을 위한 감정 인식 운율 구문 / Emotion-aware Prosodic Phrasing for Natural Text-to-Speech Rendering (4 minute read)
이 백서에서는 보다 정확한 운율 구문 예측을 위해 감정적 단서를 통합하는 모델인 EmoPP를 소개합니다. 저자들은 자연스러운 텍스트 음성 변환을 구현하는 데 있어 운율 구문의 중요성을 강조합니다.
This paper introduces EmoPP, a model that incorporates emotional cues for more accurate prosodic phrasing predictions. The authors emphasize the significance of prosodic phrasing in achieving natural-sounding Text-to-Speech.
AnthroNet: 사실적인 체형과 포즈를 생성하는 새로운 모델 / A New Model for Generating Realistic Body Shapes and Poses (16 minute read)
이 논문은 상상할 수 있는 모든 포즈의 초현실적인 가상 인간을 만들 수 있는 모델을 제안합니다. 이 모델은 가짜 데이터로만 학습된 최초의 모델이지만, 과학 및 비디오 게임에 유용할 수 있는 매우 정확한 인간 형상을 만들 수 있습니다.
This paper proposes a model that can create super-realistic virtual humans in any pose you can think of. This is the first model of its kind trained only on fake data, but it can still make highly accurate human shapes that could be useful for science and video games.
TCOVIS: 시간적 일관성이 개선된 온라인 비디오 인스턴스 세분화 / Online Video Instance Segmentation with Improved Temporal Consistency (18 minute read)
연구원들은 시간적 일관성을 우선시하는 온라인 비디오 인스턴스 세분화 기술인 TCOVIS를 도입했습니다.
Researchers have introduced TCOVIS, an online video instance segmentation technique that prioritizes temporal consistency.
그 외 소식 / Miscellaneous
허깅페이스 트랜스포머의 플래시어텐션 2 / Flash Attention 2 in HuggingFace transformers (2 minute read)
플래시 어텐션의 최신 버전은 모델 컨텍스트 길이와 성능을 개선하면서 훨씬 더 빨라졌습니다. 현재 허깅페이스 에코시스템에서 기본적으로 지원되는 과정에 있습니다.
The newest version of Flash Attention is much faster while improving model context length and performance. It is now in the process of being natively supported in the HuggingFace ecosystem.
효율적인 ML 강의 / Efficient ML course (4 minute read)
엣지에서 리소스가 적은 머신 러닝을 효율적으로 수행하는 방법에 대한 과정입니다. 강의와 숙제가 포함되어 있습니다.
Course on how to do low resource machine learning efficiently at the edge. Lectures and homework included.
LLM을 약화시키는 새로운 결과 / A New Result That Undermines LLMs (7 minute read)
언어 모델이 "A는 B"에 대해 학습된 경우, "B는 A"를 자동으로 추론하지 못합니다.
When language models are trained on “A is B”, they fail to automatically infer “B is A”.
더 읽어보기 / Quick Links
Aragon AI (Product)
셀카를 증명사진으로 바꿔보세요. 전문 사진작가가 찍은 것 같은 사실적인 AI 사진을 만들어 보세요.
Turn selfies into professional headshots. Create realistic AI photos of yourself that look like they were taken by a professional photographer.
Klu AI (Product)
데이터를 통합하여 앱과 파일 전반에서 원활하게 검색하고 발견할 수 있습니다.
Unify your data so that you can seamlessly search and discover across apps and files.
DALL-E 3가 프롬프트 엔지니어링을 사라지게 합니다 / DALL-E 3 Kills Prompt Engineering (3 minute read)
간단한 텍스트로 예술을 창조하는 DALL-E 3의 놀라운 능력은 프롬프트 엔지니어링의 미래를 위태롭게 합니다.
DALL-E 3’s amazing ability to create art from simple text puts the future of prompt engineering in jeopardy.