모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다.
오늘은 텍스트와 음성, 신뢰할 수 있는 LLM, 단백질 구조를 위한 데이터셋에 대한 이야기를 준비했어요!
오디오 생성에서 음성, 음악, 음향 효과는 각각의 특별한 목표와 편향을 가졌기에 통합하기는 매우 어려웠습니다. 이번 논문에서는 이 요소들을 각기 통합하기 위해 "Language Of Audio(LOA)"라는 오디오만의 통합된 표현 방식을 새롭게 도입했습니다. 그리고 AudioMAE라는 모델을 기반으로 음성을 LOA로 변경했습니다.
오디오를 생성할 때 GPT-2와 Diffusion 모델을 이용하여 자연스런 학습과 재사용 가능성을 높였다고 합니다! Text-to-Audio 논문이 계속 다뤄지고 있는데 앞으로의 모델이 얼마 만큼이나 좋아질지 궁금해지네요!
근래 LLM 모델에 대한 연구 중에서 인간의 의도에 따라 동작하는 것을 새롭게 연구 진행하고 있습니다. 그 일례로 OpenAI는 GPT-4를 출시하기 앞서 6개월 동안 사전 연구를 수행했습니다. 그러나 아직까지 LLM의 결과물이 사회적 규범과 가치에 맞는지 평가하는 명확한 지침이 부족한데요, 이 문제를 해결하기 위해 이번 논문에서는 LLM의 신뢰성을 평가하는 신뢰성, 안전성과 같은 7가지 주요 카테고리를 제시합니다. 이런 방식으로 신뢰도를 측정하게 된다면 LLM을 연구할 때의 Responsible AI가 도입 가능할 수 있겠다는 생각이 드네요!
단백질의 다중 서열 정렬(MSA)은 단백질 설계와 구조 예측의 핵심 요소로 오랫동안 활용되어 왔습니다. 트랜스포머를 활용한 AlphaFold2와 같은 혁신적인 기술의 등장으로 MSA의 중요성이 더욱 강조되었습니다. 그러나 MSA 생성할 때 발생하는 비용 때문에 연구 커뮤니티에 충분한 데이터 세트 제공이 어려웠습니다. 결국 단백질 관련 머신 러닝 발전에 큰 장애물로 작용되어 왔었는데요,
이를 극복하기 위해 1,600만 개의 MSA를 포함한 오픈 소스 말뭉치인 OpenProteinSet을 공개했습니다. 만약 단백질 구조 예측이 제대로 가능해진다면 새로운 게임체인저가 탄생할 것 같다라는 생각이 드네요!
모두의연구소에서 함께 공유하고 성장할 예비 개발자를 찾습니다.
AI학교 아이펠 6기 모집 중 : 아이펠 캠퍼스 - 모두의연구소가 만든 AI학교 아이펠