오늘은 Meta에서 발표한 모델을 파인튜닝하는 방법, Hugging Face가 머신러닝 민주화를 위한 AI 책임에 대한 이야기, 마지막으로 DeepMind가 만든 RoboCat에 대한 이야기입니다.
Meta AI는 2020년에 Wave2Vec2를 발표한 이후 XLSR, XLM-R 등의 사전학습 모델을 공개하여 음성인식 기술을 발전해왔습니다. 최근에는 Massive Multilingual Speech(MMS)를 공개하여 1100개의 언어로 음성을 인식하고 생성할 수 있게 되었다고 하는데요. MMS를 10분에서 20분 미세조정하면 매우 낮은 단어 오류율을 달성할 수 있다고 하니, 블로그를 참고해서 직접 확인해보세요!
다국어 음성인식을 위한 대규모 다국어 음성 어댑터 모델
Hugging Face는 최근 미국 국립통신정보국(NTIA)의 AI책임에 관한 의견 요청에 대한 응답을 블로그로 응답했다고 합니다! "좋은 머신러닝을 민주화"의 미션을 바탕으로 머신러닝 시스템의 개발과 배포를 더욱 쉽게 만들어주고, 이해관계자들이 쉽게 이해하고 질문하며 비평할 수 있도록 노력하고 있는데요. 이러한 목표를 달성하기 위해 Hugging Face는 모델을 공개하고 쉽게 사용할 수 있는 환경을 구축하며, 모델 및 환경의 구축 과정에서도 AI에 대한 책임의식을 갖는 것이 중요하는 것을 강조하고 있습니다. NTIA의 요청에 대한 응답을 투명하게 공개한 Hugging Face의 멋진 행보가 앞으로도 기대가 됩니다!
딥마인드에서 새로운 로봇 시스템을 선보였습니다! 대부분의 로봇의 경우 특정 task를 잘 할 수 있도록 프로그래밍이 되어 있죠. 물론 AI가 발전하면서 다양한 로봇을 만들 수 있게 되었지만 실제 학습 데이터를 수집하는 시간이 필요하기 때문에 범용적인 로봇이 발전하기는 어려웠습니다. 최근 공개된 RoboCat은 AI 기술을 활용하여 스스로 발전할 수 있으며, 다양한 형태의 물건을 집을 수 있고 언어 모델과 연동도 가능합니다. 이 모델은 빠른 학습 속도를 가지고 있어 100번의 데모 정도로도 새로운 작업을 익힐 수 있다고 합니다. 정말 흥미롭지 않나요!
RoboCat: A self-improving robotic agent
- AI학교 아이펠 ‘쏘카 캠퍼스’에서 데이터 AI 엔지니어로 함께 성장해요!