[230322] 모두의연구소가 전하는 오늘의 AI소식

안녕하세요, 즐거운 수요일 저녁이에요 :wink:
오늘의 AI 소식 전달드립니다 !!

엔비디아 GTC 2023에서 개발자가 클라우드를 사용하는 정도의 이미지나 컴퓨터 비전에서 효율적으로 만들 수 있는 오픈소스 라이브러리 CV-CUDA를 소개했습니다. CV-CUDA는 기존에 사용하는 CUDA와 달리 GPU를 대량으로 사용할 때 유용하다 생각합니다. CV-CUDA는 엔비디아뿐만 아니라 바이트댄스와의 협업으로 만들어졌고 0.2.1 alpha 버전까지 나온 상황입니다. CV-CUDA에 관심 있다면 클릭해주세요!

OpenAI의 지향점이 AGI에 있는것처럼 엔비디아는 conversational AI를 지향점 중 하나로 설정하고 있습니다. Conversational AI란 실시간으로 AI가 작동해서 외국인과 대화를 할때 실시간으로 음성번역을 하고 기존 목소리에 음성생성하는 인공지능입니다. Conversational AI가 잘 작동하려면 빠른 추론속도, E2E 서비스를 제공해야 합니다. Nvidia의 NeMo는 점차 업데이트를 진행하고 있으며 추후에 강력한 프레임워크로 작용할 가능성이 높다고 생각합니다.

현재 generative AI 트렌드에 맞춰 Nvidia도 Picasso라는 모델을 공개했습니다. Picasso는 클라우드 서비스로 제공될 계획이며 Nvidia DGX 클라우드로 학습, 최적화, 추론까지 가능하게 만들었다고 합니다. Picasso가 다른 generative AI와 다른점은 Text-to-image뿐만 아니라 Text-to-Video 더 나아가 Text-to-3D도 가능합니다. 가장 매력적으로 다가온 건 Text-to-3D였습니다. 현재 핫한 분야중 하나인 NeRF가 2D를 3D로 만드는 상황인데 그것보다 진일보된 모델이 나온거라 생각하기 때문입니다. 해당 내용에 관심이 있다면 클릭해주세요!

1개의 좋아요