Google, 과학 연구 과정에서 연구자를 돕는 'AI 공동연구자(AI Co-Scientist)' 공개 (feat. Gemini 2.0)

Google의 AI 공동연구자(AI Co-Scientist) 소개

과학적 발견은 연구자들의 창의성과 통찰력, 그리고 방대한 연구 문헌에서 얻은 전문 지식을 결합하여 이루어집니다. 하지만 연구 논문의 양이 기하급수적으로 증가하는 가운데, 새로운 분야의 지식을 통합하는 것은 점점 더 어려운 일이 되고 있습니다. 이러한 상황에 대응하기 위해 Google은 과학 연구 과정에서 연구자를 돕는 시스템을 연구하고 있습니다. 최근 공개한 Towards an AI Co-Scientist 라는 논문에서 Google은 이러한 AI 기반 연구 보조 시스템의 개념을 AI 공동연구자(AI Co-Scientist) 라는 이름으로 소개하고 있으며, 이를 통해 연구자들이 보다 효율적이고 창의적인 과학적 발견을 할 수 있도록 돕는 방법을 제시하고 있습니다. AI 공동연구자(AI Co-Scientist) 시스템은 연구 가설을 생성하고 실험 계획을 세우는 데 도움을 주며, 특히 생의학 분야에서 실제 실험을 통해 그 유효성이 검증되었습니다.

구체적으로, AI 공동연구자는 구글 딥마인드, 구글 리서치, 스탠포드 대학 등의 연구진이 개발한 Gemini 2.0 기반의 멀티 에이전트 시스템입니다. 이 시스템은 연구자들이 제시한 연구 목표를 바탕으로 가설을 생성하고, 검토하고, 평가하여 최종적으로 발전된 연구 제안을 생성하는데 도움을 주는 도구입니다. 이 시스템은 단순히 논문을 요약하고 정보를 정리하는 것을 넘어서, 연구 목표에 맞춘 새로운 연구 가설과 실험 계획을 생성할 수 있도록 설계되었습니다. AI 공동연구자는 과학적 탐구 방법론을 기반으로 하며, 연구자와 협업하는 방식으로 동작합니다. 연구자가 연구 목표를 설정하면, AI 공동연구자는 이를 다양한 알고리즘을 통해 분석하고 적절한 가설을 생성합니다. 또한 웹 검색 및 특수 AI 모델을 활용하여 가설의 신뢰도를 높이고 보다 정교한 연구 방향을 제시합니다.

AI 공동연구자(AI Co-Scientist) 시스템 개요

AI Co-Scientist는 과학적 사고를 구조화된 프로세스로 구현한 AI 기반 연구 보조 시스템입니다. 연구자는 자연어로 연구 목표를 입력하면, 시스템은 이를 기반으로 적절한 가설을 생성하고 발전시킵니다. 이 과정에서 AI Co-Scientist는 “생성-토론-진화(generate, debate, evolve)” 라는 핵심 원칙을 따릅니다. 이는 연구자가 제공한 목표에 맞춰 가설을 만들고, 내부적으로 논쟁과 검증을 거치며, 지속적인 개선을 통해 최적의 연구 가설을 도출하는 방식입니다.

이 시스템의 중요한 특징 중 하나는 비동기적(asynchronous) 작업 실행 프레임워크를 사용하여 대규모 계산 자원을 유연하게 활용할 수 있다는 점입니다. 즉, 연구자의 연구 목표에 따라 필요한 계산 자원을 동적으로 할당하며, 과학적 논리를 최대한 활용할 수 있도록 설계되었습니다. 또한, 생성된 연구 가설은 단순한 요약 수준을 넘어서 연구 제안서 수준의 상세한 계획을 포함할 수 있도록 구성되어 있습니다.

AI Co-Scientist는 연구의 핵심 단계를 담당하는 여러 개의 특화된 AI 에이전트(Agent)들이 유기적으로 협력하는 다중 에이전트 시스템(MAS, Multi-Agents System)입니다. 각 에이전트는 고유한 역할을 수행하며, 서로 피드백을 주고받으며 최적의 결과를 도출하는 구조를 가집니다. 주요 에이전트의 역할은 다음과 같습니다:

  1. 생성 에이전트(Generation Agent): 연구 목표에 따라 초기 연구 가설을 생성하는 역할을 수행합니다. 이 과정에서 AI는 웹 검색, 학술 논문 분석, 기존 연구 결과 요약 등의 방법을 활용하여 새로운 아이디어를 도출합니다. 또한, 내부적으로 가상의 학문적 토론을 진행하여 아이디어의 완성도를 높이며, 기존 연구와 비교하면서 새로운 연구 방향을 탐색합니다.

  2. 반영 에이전트(Reflection Agent): 생성된 가설을 검토하고, 논리적 타당성을 평가하며, 기존 연구와의 차별성을 분석하는 역할을 수행합니다. 이 과정에서 가설의 근거가 부족하거나 과학적으로 신뢰할 수 없는 요소가 발견되면 수정이 이루어집니다. 또한, AI가 자체적으로 연구의 한계를 파악하고 이를 연구자에게 피드백할 수 있도록 설계되었습니다.

  3. 순위 평가 에이전트(Ranking Agent): 다양한 연구 가설을 비교하고, 가장 유망한 가설을 선정하는 역할을 담당합니다. AI Co-Scientist는 Elo 기반 토너먼트 방식을 활용하여 가설의 품질을 평가하는데, 여러 가설을 쌍(pair)으로 비교하며 상대적으로 더 강력한 가설을 상위에 배치하는 방식입니다. 이를 통해 AI는 스스로 가장 설득력 있는 연구 가설을 찾고 발전시킬 수 있습니다.

  4. 진화 에이전트(Evolution Agent): 생성된 가설을 발전시키고 개선하는 역할을 수행합니다. 상위 평가를 받은 가설들을 조합하거나, 연구자의 피드백을 반영하여 보다 실험적으로 검증 가능한 형태로 발전시키는 과정이 포함됩니다. 또한, 기존 연구에서 사용되지 않은 새로운 접근 방식을 도입하는 역할도 수행합니다.

  5. 근접성 평가 에이전트(Proximity Agent): 생성된 가설들 간의 유사성을 분석하고, 중복된 아이디어를 정리하여 연구 방향이 과도하게 한쪽으로 치우치지 않도록 조정합니다. 또한, 연구자가 관심을 가질 만한 가설을 추천하는 역할을 수행합니다.

  6. 메타 검토 에이전트(Meta-Review Agent): 연구 진행 과정을 요약하고, 연구자에게 제공할 최종 연구 개요를 정리하는 역할을 담당합니다. 또한, 시스템 내부에서 가설들이 어떻게 개선되었는지 분석하고, 향후 연구 방향을 제안하는 데 활용됩니다.

AI Co-Scientist는 단순한 자동 연구 생성 시스템이 아니라, 연구자와 적극적으로 상호작용할 수 있도록 설계된 협업 시스템입니다. 연구자는 AI와 자연어 기반의 인터페이스를 통해 대화하며, 연구 목표를 설정하고 결과를 피드백할 수 있습니다:

  1. 연구 목표 입력: 연구자는 특정한 연구 주제나 문제를 AI Co-Scientist에 입력할 수 있습니다. 이 과정에서 특정 실험 조건, 제약 사항, 선호하는 연구 방향 등을 자연어로 설명할 수 있습니다.

  2. 아이디어 및 가설 추가: AI가 제안한 가설 외에도 연구자가 직접 새로운 아이디어를 제안할 수 있으며, 이 아이디어는 AI가 생성한 가설과 함께 평가되어 최적의 연구 방향을 찾는 데 활용됩니다.

  3. 연구 결과 검토 및 피드백 제공: 연구자는 AI가 생성한 연구 가설과 실험 계획을 검토하고, 자신의 의견을 반영할 수 있습니다. 예를 들어, 특정 가설이 과거 연구와 충돌하거나 실험적 검증이 어렵다고 판단될 경우 이를 AI에게 피드백하여 새로운 가설을 탐색하도록 요청할 수 있습니다.

  4. 대화형 인터페이스 활용: AI Co-Scientist는 연구자가 실시간으로 질문을 하거나 의견을 나눌 수 있는 대화형 인터페이스를 제공합니다. 이를 통해 연구자는 AI가 생성한 가설에 대한 설명을 듣고, 특정 부분에 대한 추가 조사를 요청할 수도 있습니다.

과학적 추론을 위한 테스트-시간 연산(Test-Time Compute) 확장

테스트-시간 연산(TTC, Test-Time Compute)는 AI 모델이 사전 학습(pre-training)된 정보만을 기반으로 답변을 생성하는 것이 아니라, 추가적인 계산을 수행하여 보다 정교한 결과를 도출하는 방식을 의미합니다. 일반적인 대형 언어 모델(LLM)은 훈련된 지식을 바탕으로 즉각적인 응답을 생성하지만, TTC를 활용하면 모델이 보다 깊은 탐색을 수행하고, 다양한 가능성을 평가하며, 점진적으로 정제된 결론을 도출할 수 있습니다. (:pytorch::kr: 더 읽어보기: [Deep Research] Test Time Compute 및 Test Time Scaling의 개념과 최신 연구 동향에 대한 보고서)

AI 공동연구자는 테스트-시간 연산(TTC)를 확장하여 연구 가설을 반복적으로 생성, 평가, 개선하는 방식으로 과학적 추론을 수행합니다. 이를 위해 자기 강화(Self-Play) 기반의 과학적 토론, 가설 비교를 위한 순위 평가 토너먼트, 그리고 가설 품질 향상을 위한 진화 프로세스를 적용합니다. 또한, 시스템은 자기 비판적 검토(recursive self-critique)를 통해 웹 검색 및 도구 활용을 통한 피드백을 반영하여 가설을 정교하게 다듬습니다.

시스템의 자기 개선 과정에서 핵심 역할을 하는 것은 Elo 자동 평가(Elo auto-evaluation)입니다. 연구진은 Elo 점수가 실제 연구 가설의 품질과 얼마나 상관관계가 있는지를 검증하기 위해 GPQA(Google-Proof Question Answering) 벤치마크의 난이도 높은 문제를 활용하였습니다. 그 결과, Elo 점수가 높은 연구 가설일수록 정답 가능성이 높다는 점이 확인되었습니다.

또한, 7명의 전문가가 15개의 개방형 연구 목표와 기존 최선의 해법을 정리한 후, AI 공동연구자가 생성한 가설과 최첨단 AI 모델 및 인간 연구자의 결과를 비교했습니다. 자동 Elo 평가 기준에 따르면, AI 공동연구자가 다른 모델 및 인간 전문가보다 더 높은 성과를 보였습니다. 이 분석은 과학적 방법론에서 도출된 귀납적 편향(inductive biases)이 테스트 타임 컴퓨트를 통해 효과적으로 확장될 수 있음을 재확인하는 결과를 도출했습니다. 즉, AI가 더 많은 시간을 들여 가설을 평가하고 개선할수록 자체 평가 점수가 증가하며, 최종적으로는 모델 및 인간 전문가의 성과를 뛰어넘는 결과를 생성하게 됩니다.

추가적으로, 연구진은 11개의 연구 목표에 대해 AI 공동연구자가 생성한 가설의 새로움(novelty)과 영향력(impact)을 전문가들이 평가하도록 하였습니다. 샘플 수는 제한적이었으나, AI 공동연구자의 결과가 다른 모델보다 높은 혁신성과 영향을 가질 가능성이 크다는 평가를 받았으며, 전문가들이 선호하는 결과를 생성하는 경향을 보였습니다. 흥미롭게도, 이러한 인간 전문가의 평가 결과는 앞서 소개한 Elo 자동 평가 점수와도 높은 일치도를 나타내어, Elo 평가 방식이 가설의 품질을 효과적으로 측정할 수 있는 지표가 될 가능성을 시사했습니다.

AI 공동연구자의 실제 연구 사례

AI 공동연구자는 다양한 과학 분야에서 연구자들과 협력하여 새로운 가설을 생성하고, 이를 검증하는 역할을 수행합니다. 특히 생명과학 및 의학 분야에서 중요한 문제를 해결하는 데 적용되었으며, 현재까지 세 가지 핵심 연구 사례에서 유의미한 성과를 거두었습니다.

약물 재창출(Drug Repurposing) - 급성 골수성 백혈병(AML) 치료 후보 발굴

신약 개발은 막대한 비용과 오랜 시간이 소요되는 과정입니다. 이에 따라 기존 승인된 약물을 새로운 질병 치료에 활용하는 약물 재창출(Drug Repurposing) 이 중요한 연구 분야로 주목받고 있습니다. AI 공동연구자는 약물-질병 관계를 분석하고, 새로운 치료 가능성을 탐색하는 과정에서 활용되었습니다.

연구진은 AI 공동연구자에게 급성 골수성 백혈병(AML) 치료에 적합한 기존 약물을 탐색하도록 설정하였습니다. 시스템은 문헌 검색과 데이터 분석을 통해 기존에 AML 치료제로 사용되지 않았지만 유망한 후보군을 도출하였으며, 이를 토대로 임상 적용이 가능한 농도에서 암세포 억제 효과를 나타내는 후보 물질을 발견하였습니다.

AI 공동연구자가 제안한 여러 후보 중, Binimetinib, Pacritinib, KIRA6, Leflunomide 등의 약물이 특히 주목을 받았습니다. 이후 실험실(In vitro) 검증을 진행한 결과, 이들 약물이 특정 AML 세포주에서 종양 억제 효과를 보였으며, 기존 약물 대비 새로운 치료 가능성을 제시하였습니다.

이는 AI가 기존 연구와 연결되지 않은 약물-질병 관계를 찾아내어, 연구자들이 실험적 검증을 통해 새로운 치료법을 개발할 수 있도록 지원하는 역할을 수행할 수 있음을 의미합니다.

간 섬유화 치료를 위한 새로운 치료 타겟(Novel Target Discovery) 발굴

간 섬유화(liver fibrosis) 는 간경변 및 간암으로 진행될 수 있는 심각한 질환이지만, 현재까지 효과적인 치료법이 제한적입니다. AI 공동연구자는 이 문제를 해결하기 위해 새로운 후성유전학적(epigenetic) 치료 타겟을 제안하는 데 활용되었습니다.

연구진은 AI 공동연구자에게 간 섬유화 진행 과정에서 중요한 후성유전학적 변화를 분석하도록 설정하였습니다. 이를 통해 AI는 기존 연구에서 충분히 탐색되지 않았던 세 가지 새로운 후성유전학적 타겟을 제안하였으며, 연구자들은 이 타겟을 기반으로 새로운 치료 후보 물질을 선정하여 실험을 진행하였습니다.

AI 공동연구자가 제안한 후성유전학적 타겟을 기반으로 개발된 네 가지 후보 약물이 간 오가노이드 실험에서 항섬유화 효과를 보였으며, 일부 약물은 이미 FDA 승인을 받은 상태에서 새로운 적응증으로 활용될 가능성이 있는 것으로 나타났습니다.

이 연구는 AI가 단순히 기존 연구를 요약하는 것이 아니라, 실험적으로 검증할 수 있는 새로운 생물학적 타겟을 제안하고, 이를 통해 신약 개발 과정을 가속화할 수 있음을 보여준 사례입니다.

박테리아 유전자 전이 메커니즘 분석 및 항생제 내성(Antimicrobial Resistance) 연구

항생제 내성(Antimicrobial Resistance, AMR) 은 현대 의학에서 가장 심각한 문제 중 하나로, 박테리아가 항생제에 대한 내성을 획득하면서 기존 치료법이 무력화되는 현상을 의미합니다. 연구진은 AI 공동연구자가 박테리아 유전자 전이 메커니즘을 분석하여 항생제 내성과 관련된 새로운 과학적 발견을 도출할 수 있는지 평가하였습니다.

AI 공동연구자에게 박테리아 간 유전자 전이가 어떻게 발생하는지, 그리고 이를 통해 항생제 내성이 확산되는 과정을 분석하도록 설정하였습니다. 이 과정에서 AI는 기존 연구 결과를 종합적으로 분석하고, 새로운 가설을 생성하는 작업을 수행했습니다.

놀랍게도 AI 공동연구자는 cf-PICI(캡시드 형성 가능한 박테리아 크로모좀 섬, capsid-forming phage-inducible chromosomal islands)의 이동 메커니즘을 정확히 예측하였으며, 이는 독립적인 연구팀이 10년간 진행한 실험적 연구 결과와 동일한 결론을 단 2일 만에 도출하였습니다. (연구 논문 링크)

이러한 결과는 AI가 기존 연구자의 경험과 실험적 데이터 없이도 생물학적 메커니즘을 추론하고, 연구 방향을 제시할 수 있음을 시사하는 중요한 사례로 평가됩니다.

결론: AI 공동연구자의 가능성과 지속적 개선 필요성

AI 공동연구자는 연구 속도를 획기적으로 향상시키고, 새로운 연구 방향을 제안하며, 연구자와 협력하여 창의적인 연구 결과를 도출할 수 있는 강력한 도구입니다. 하지만, 데이터 접근성, 실험 검증 부족, 편향성과 윤리적 문제 등 해결해야 할 한계점도 분명히 존재합니다.

앞으로 AI 공동연구자는 더욱 정교한 연구 검증 시스템을 갖추고, 연구자와의 협업을 강화하며, 보다 공정하고 윤리적인 연구 지원 시스템으로 발전해야 할 것입니다. 이를 통해 AI가 과학적 발견을 촉진하는 혁신적인 도구로 자리 잡을 수 있을 것으로 기대됩니다.

:scroll: Google의 AI 공동연구자(AI Co-Scientist) 소개 블로그

:scroll: Google의 AI 공동연구자에 대한 논문: Towards an AI Co-Scientist

:google: AI 공동연구자에 대한 테스터 접근 권한 요청

We are excited by the early promise of the AI co-scientist system and believe it is important to evaluate its strengths and limitations in science and biomedicine more broadly. To facilitate this responsibly we will be enabling access to the system for research organizations through a Trusted Tester Program. We encourage interested research organizations around the world to consider joining this program here.




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:kr:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:gift: 아래:arrow_lower_right:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck:

2개의 좋아요

tool이 아니라 사람과 함께 연구할 수 있는 AI research라니 먼 미래가 아닌가보네요 .. :hushed:

1개의 좋아요