안녕하세요
국내 최대 오프라인 인공지능 커뮤니티 모두의연구소입니다!
오늘은 구글 리서치에서 발표한 차트를 분석하는 Foundation 모델, NCSOFT에서 AI Researcher로 근무하고 계신 한울님의 이야기 마지막으로 4족보행로봇을 위한 벤치마크 데이터셋에 대해 이야기할 예정입니다.
구글 리서치에서 시각언어를 추론하는 모델을 발표했습니다. 시각언어는 도표, 인포그래픽스 등 숫자로 되어 있는 것들을 시각화를 통해 보여주는 것을 의미합니다. 이전 기법에서는 OCR를 기반으로 추출하고 그것에 맞춰 학습을 진행했다면 구글 리서치에서 발표한 MatCha는 차트를 디렌더링하거나 수학적 추론을 기반으로 하는 모델입니다. 그렇다보니 실제 성능도 좋아졌으며 특정 task에만 국한되는 것이 아닌 범용적으로도 사용할 수 있는 모델입니다. 또한 해당 추론을 도와주는 데이터셋까지 공개했으니.. 관심있는 분들은 해당 블로그를 참고해주세요!
저번주 화요일에 NCSOFT에서 리서쳐로 근무하고 있는 이한울 연구원님께서 비전공자가 어떻게 AI 커리어를 쌓았는지에 대한 세미나를 진행했습니다. 이한울 연구원님은 비전공자가 장점이 될 수 있는 것들과 장벽에 대해 언급해주셨고 조언까지 아낌없이 진행해주셨습니다. 한울님의 경험공유를 듣고 싶다면 모두연 블로그에 들어오셔서 확인해주세요!
구글 리서치에서 로봇에 대한 연구를 진행할 때 사람의 움직임만큼 동물의 움직임을 만들고 있습니다. 강아지와 같은 동물은 4족 보행으로 움직이기 때문에 특정 task에서 2족보행하는 사람보다 더 민첩하거나 유연하게 움직일 수 있습니다. 그러나 아직까지 이런 움직임에 대한 벤치마크가 존재하지 않았기에 Backour라는 데이터셋을 공개해 고르지 않은 지형을 횡단하거나 장애물을 뛰어넘는 것과 같은 테스크로 다양한 모델이 만들어지게끔 기여했습니다.
모두의연구소가 만든 인공지능혁신학교 AIFFEL 모집중
모집 링크 : 아이펠 캠퍼스 - 오프라인보다 나은 AI학교