[230623] 모두의연구소/아이펠이 전해드리는 오늘의 AI소식!

안녕하세요
국내 최대 오프라인 인공지능 커뮤니티 모두의연구소입니다...!!

  1. 구글의 최신 음악 창작 AI 모델 탄생!

구글 리서치에서 오디오 생성 관련 AI모델을 공개했습니다! AudioLM, SPEAR-TTS, 음악 생성인 AudioGen 등 이전까지 오디오 생성 모델은 Transformer 기반으로 이뤄졌었는데요. 높은 성능 대비 긴 시퀀스를 디코딩을 할때 느려지는 단점이 있었죠. 이번에 발표된 SoundStorm은 오디오 토큰에 맞게 조정된 설계와 MaskGIT에서 가져온 디코딩 시스템으로 효율적인 병렬처리를 구현했다고 합니다!

SoundStorm: Efficient parallel audio generation

  1. PyTorch 2.0 추론 속도 폭발! 자체 개발 CPU의 힘!

차세대 AWS Graviton CPU로 PyTorch 2.0 추론 최적화 방법을 담은 블로그 글을 소개합니다! AWS Graviton은 자체 개발한 64비트 CPU로, PyTorch 2.0 사용 시 다른 CPU 인스턴스보다 훨씬 빠른 속도라고 해요! 자체적인 Kernel과 Arm compute library 등을 저수준에서 개선됐다고 하는데요 자세한 내용은 아래 블로그 링크에서 확인해보세요!

Optimized PyTorch 2.0 Inference with AWS Graviton processors

  1. Segment Anything 모델 저비용 고효율 사용 방법!

메타에서 제공한 Segment Anything 모델은 다양한 컴퓨터 비전에서 사용되고 있죠. 하지만 Segment Anything 모델은 사용 시간 대비 고비용으로 비즈니스에 활용하기 쉽지가 않습니다. 오늘 소개해드리는 논문에서는 Segment Anything 모델을 사용하여 속도를 높일 수 있는 방법을 제시합니다. Segment Anything모델을 인스턴스 분할 테스크로 전환하고 SAM 저자들이 진행한 데이터셋의 1/50만 사용해도 충분히 성능을 개선할 수 있다고 하니 비용절감의 이득을 볼 수 있을 것 같아요.

Fast Segment Anything

  • AI학교 아이펠 ‘쏘카 캠퍼스’에서 데이터 AI 엔지니어로 함께 성장해요!

아이펠 캠퍼스 - 모두의연구소가 만든 AI학교 아이펠 (aiffel.io)

1개의 좋아요