안녕하세요
국내 최대 인공지능 커뮤니티 모두의연구소입니다!
오늘은 RLHF에 대한 논문, Med-Flamingo 모델, 마지막으로 Skeleton-of-Thought에 대한 소식입니다.
RLHF는 사람보다 나은 목표에 맞춰 AI시스템을 학습하는 기법이며 LLM을 미세조정하는데 사용되는 핵심 기법입니다. 현재 RLHF가 선풍적인 인기가 얻고 있는 상황과 상반되게 아직까지 어떤 우위점이 있는지 명확히 정리된 상세 사항이 공개된 적이 없었는데요, 이번 논문은 RLHF의 문제점과 근본적인 한계를 이야기하고 실제 RLHF를 개선 및 보완하기 위한 기술에 대해서도 이야기합니다. 또한 RLHF기법이 사회적인 맥락을 개선하기 위한 하나의 표준임도 함께 제시합니다.
RLHF를 폭넓게 연구해서 사용하고 있지만 이 정도로 폭넓게 연구한 논문 또한 흔치 않아서 이번에
공유드립니다.
구글에서 Med-PaLM2를 테스트 중이라는 소식이 있었는데요, 이번에 스탠포드 대학교에서 Med-Flamingo이라는 의학적 지식을 갖춘 생성 비전 언어 모델을 새롭게 공개했습니다.
Med-Flamingo의 경우 이름에서 알 수 있듯이 Flamingo라는 LLM을 활용해서 만들었습니다. 특히 Med-Flamingo는 몇 번의 촬영으로 의료용 시각적 질의응답 기능을 제공합니다.
성능 또한 우수한 편인데요, 실제 임상의와의 평가에서 결과값을 20%까지 향상시키고 멀티모달 의료 적용을 가능하게 만들었습니다.
해당 모델에 대한 상세 내용은 깃헙에 공유되어 있으니까 한번 확인해보시면 어떨까요!
Skeleton-of-Thought라는 새로운 프롬프트 엔지니어링 기법이 공개되었습니다.
Skeleton of Thought(SoT)의 목표는 빠르게 결과를 도출할 수 있게 만드는 것입니다. 그렇기에 SoT는 이름에서 알 수 있듯 LLM이 먼저 답변의 골격을 생성한 이후 병렬로 디코딩을 수행해 골격 포인트의 내용을 병렬로 완성하는 기법입니다.
해당 프롬프트 엔지니어링으로 SoT는 속도 측면에서 상당한 향상율을 기록하였으며 여러 질문 범주에 대한 답변 품질을 잠재적으로 개선할 수 있습니다.
프롬프트 엔지니어링으로 속도 개선까지 이뤄낼 수 있다는 점이 놀랍네요!
AI 90% 순도 높은 아이펠만의 커리큘럼으로 배우세요!
- AI학교 아이펠 무료 입학하기 : 아이펠 캠퍼스 - 모두의연구소가 만든 AI학교 아이펠