안녕하세요
국내 최대 오프라인 인공지능 커뮤니티 모두의연구소입니다!
오늘은 구글의 Med-PaLM-2, GPT-4를 활용한 Bouding box 그리고 그걸 이용한 자연어 추론, 마지막으로 작은 LLM모델로 수학연산가능하게 만들기에 대한 이야기입니다!
구글이 Mayo 병원과 다른 병원들에서 Med-PaLM 2 AI채팅 기술을 시험하고 있다고 합니다.
기존 모델들과 달리 Med-PaLM2는 의료 전문가들의 데모도 이미 진행했을 뿐만 아니라 의료 면허 시험에 대한 질문과 답변 또한 학습되었다고 합니다.
의료 채팅 AI서비스는 의료 행정 뿐만 아니라 실제로 몸이 아플 때 진단 또한 가능한데요 이 부분은 의료 인프라가 빈약하고 의사가 많지 않은 국가일 경우 매우 혁신적일 것 같다는 생각이 듭니다.
다만 Med-PaLM2도 다른 LLM과 마찬가지로 아직까지는 Hallucination으로 인해 100%의 정확도를 기록하지 않기 때문에 조금 더 신중하게 접근해야 된다고 생각합니다!
GPT-4는 처음 나왔을 때 이미지와 텍스트 처리 2개 모두 가능한 모델인 점에서 다른 모델들과 차별화되었습니다. 이번 논문은 이미지와 텍스트를 활용한 Insturction Tuning기법을 설명해주는데요,
해당 모델의 가장 중요한 포인트는 바운딩 박스를 처리해서 공간을 재구성하는 것입니다.
실제 예시를 보면 거리에서 우산을 쓰고 책 읽는 아이가 있는데 이를 바운딩 박스로 처리하고 해당 내용에 대해 GPT-4와 대화를 합니다. 그리고 GPT-4에게 추론을 요구하는데 이때 GPT-4는 아이가 길거리에서 책을 읽으면 시야가 좁아져서 위험하다고 전달합니다.
과거에는 프로그래밍으로 해당 내용을 파악했다면 이제는 자연어를 통해 추론까지 파악하다니~
정말 GPT-4는 놀라운 것 같습니다!
GPT-4나 PaLM2와 같은 모델들은 LLM으로써 다양한 task들을 수행할 수 있습니다. 그러나 LLM은 직접 만들기에는 비용이 많이 들고 추론을 진행할 때에도 역시나 높은 비용이 드는 것이 사실입니다. 그렇기에 LLM같은 규모가 큰 모델보다 작은 모델들을 기반으로 한 가지 task를 제대로 수행하는 것이 요즘 산업계에서는 오히려 더 효율적일 수 있습니다.
이번 논문에서는 작은 모델을 기반으로 수학적인 연산이 가능하도록 만들어 어느 정도 유의미한 성과를 얻은 사례를 설명하는데요, 본 논문에 이강욱 위스콘신 대학교 교수님도 함께 저자로 포함되어 있어서 공유드립니다.
AI학교 아이펠 ‘쏘카 캠퍼스’에서 데이터 AI 엔지니어로 함께 성장해요!
아이펠 캠퍼스 - 모두의연구소가 만든 AI학교 아이펠 (aiffel.io )