[GN] 2023년, 많은 관심을 받은 NVIDIA의 10가지 연구 정리

GeekNewsxguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. :smiley_cat:


소개

[GN] 2023년, 많은 관심을 받은 NVIDIA의 10가지 연구

Neuralangelo: stunning high-fidelity 3D surface reconstruction.

Neuralangelo는 NVIDIA에서 개발한 신경망을 사용한 고해상도 3D 표면 재구성을 위한 AI 모델입니다. 이 모델은 2D 비디오 클립을 건물, 조각상과 같은 상세한 3D 구조로 변환합니다. 기존의 사진 측량 도구에 대한 AI 기반 대안을 제공합니다.

Magic3D: text-to-3D is coming fast!

Magic3D는 NVIDIA에서 개발한 텍스트 기반 3D 콘텐츠 생성 도구로, 고품질의 3D 메쉬 모델을 생성하며 이미지 조절 및 프롬프트 기반 편집을 통해 사용자가 3D 합성을 제어할 수 있는 새로운 방법을 제공합니다. 다양한 창작 응용 프로그램을 가능하게 합니다.

Hair Simulation: efficient simulation of Discrete Elastic Rods (DER) for hair. This isn't quite an AI work, but very visually appealing.

NVIDIA의 헤어 시뮬레이션 프로젝트는 GPU에서 쿨롱 마찰을 가진 이산 탄성 막대(DEM)를 시뮬레이션하기 위한 도구를 개발하였으며, 이를 통해 머리카락의 상호작용 시뮬레이션을 향상시킵니다.

Eureka: GPT-4 teaches a 5-finger robot hand how to spin pens better than I do! This is my team's work on bridging the gap between high-level reasoning and low-level dexterity.

GPT-4에 의해 구동되는 Eureka는 강화 학습에서 보상 디자인을 개선하는 것을 목표로 하는 NVIDIA Research의 프로젝트입니다. 이 프로젝트는 일반적으로 시행착오 과정인 보상 디자인의 문제를 극복하는 데 중점을 둡니다.

Align Your Latents: high-resolution video synthesis with latent diffusion models. One of the best video generation works in 2023, coauthored by a few OG authors of Stable Diffusion.

이 프로젝트는 고해상도 비디오 생성을 위해 잠재 확산 모델(LDM)을 적용하며, 실제 드라이빙 데이터 시뮬레이션과 텍스트 기반 영상 모델링과 같은 실제 응용 프로그램에 중점을 둡니다. 이 접근법은 사전 훈련된 이미지 LDM을 효율적이고 표현력 있는 텍스트-투-비디오 생성에 활용합니다.

Text2Materials: text prompt to generate materials like brick or mosaic that are tileable and seamlessly replicated over a surface of any size.

이 연구는 예술가들이 텍스트 또는 이미지 프롬프트를 사용하여 사용자 정의된 질감 재료(예: 직물, 목재, 돌 등)를 더 빠르고 세밀하게 창작할 수 있도록 하는 방법을 시연합니다.

CALM: a method to train steerable virtual characters to perform acts in a physics simulation.

CALM(조건부 적대적 잠재 모델)은 인간의 동작의 복잡성과 다양성을 포착하는 동작 표현을 학습하여 주어진 동작을 단순히 복제하는 것이 아니라 캐릭터 동작을 직접 제어할 수 있게 합니다. 이는 제어 정책과 동작 인코더를 결합하여 효과적인 동작 재구성을 가능하게 합니다.

Vid2Player3D: learning Tennis skills for virtual characters!

이 시스템은 방송 비디오에서 추출한 대규모 테니스 경기 데모를 통해 다양한 물리적으로 시뮬레이션된 테니스 기술을 학습합니다. 스탠퍼드 대학교, NVIDIA, 토론토 대학교, 벡터 연구소 및 사이먼 프레이저 대학교가 협력하여 개발하였습니다.

Flexicubes: efficient and high-quality mesh optimization.

FlexiCubes는 기하학적, 시각적 또는 물리적 목표에 대한 기울기 기반 메쉬 최적화를 위해 특별히 설계된 고품질의 등위면 표현입니다. 다양한 응용 프로그램에서 결과를 개선하는 것으로 나타났습니다.

eDiff-I: Text-to-Image diffusion with ensemble of expert denoisers.

텍스트 기반 이미지 합성, 스타일 전송, 단어를 사용한 직관적인 그림 등을 제공하는 생성 AI 콘텐츠 생성 도구입니다.

원문

https://x.com/DrJimFan/status/1738613195173159187

출처 / GeekNews

1개의 좋아요