Google Research at I/O 2026 소개
매년 Google I/O는 검색, 안드로이드, 클라우드 같은 제품 발표의 무대로 알려져 있지만, 그 발표들 뒤에는 수년간 축적된 기초 연구가 자리하고 있습니다. Google Research가 I/O 2026에 맞춰 공개한 이번 정리 글은 제품 데모가 아니라, 그 제품들을 가능하게 만든 연구 성과를 한자리에 모은 것입니다. 과학적 발견, 의료, 엣지 하드웨어, 기상 예측, 생성형 AI, 개발자 도구, 프라이버시, 양자 컴퓨팅에 이르기까지 폭넓은 분야를 다루며, 각 분야에서 연구가 어떻게 실제 제품과 서비스로 이어졌는지를 보여줍니다.
Google이 이번 정리에서 반복적으로 강조하는 키워드는 에이전트 시대(Agentic Era) 입니다. 단일 질문에 단일 답변을 내놓던 모델에서 벗어나, 여러 하위 에이전트가 협업하며 가설을 세우고 코드를 작성하고 실험을 반복하는 방식으로 연구와 개발의 패러다임이 옮겨가고 있다는 것입니다. 새로 발표된 Gemini 3.5 Flash와 에이전트 개발 플랫폼 Antigravity 2.0이 그 흐름의 중심에 있으며, 이 모델들이 과학 연구용 도구부터 개발자 자동화 워크플로우까지 동일한 기반 위에서 작동합니다.
이 글에서는 Google Research가 연구에서 현실로(research to reality) 이어지는 "매직 사이클"이라고 부르는 흐름을 따라, 각 분야의 핵심 성과를 정리합니다. 개별 발표 하나하나는 별도의 논문이나 블로그로 깊이 다룰 만한 주제이지만, 여기서는 전체 지형을 한눈에 조망하고 관심 있는 주제로 깊이 들어갈 수 있도록 풍부한 링크와 함께 구성했습니다. 참고로 I/O 2026의 제품 측면 발표 정리는 PyTorchKR 커뮤니티의 Google I/O 2026 주요 발표 정리 글에서 확인하실 수 있습니다.
과학적 발견의 새 시대: Gemini for Science
이번 정리에서 가장 비중 있게 다뤄진 분야는 과학 연구를 가속하는 AI입니다. Google은 I/O에서 Gemini for Science를 발표했는데, 이는 가설 생성부터 계산 실험까지 과학적 방법론 전 과정을 지원하는 실험적 도구 모음입니다. 이 도구들의 토대가 된 두 가지 기초 연구인 경험적 연구 보조(Empirical Research Assistance, ERA) 와 Co-Scientist 는 모두 지난주 Nature 에 게재되었습니다.
ERA는 과학자가 전문가 수준의 경험적 소프트웨어를 작성하도록 돕는 연구용 코딩 시스템입니다. Nature 논문으로 정식 발표되기까지 학술 파트너들과 수개월간 협업했고, 신경과학부터 우주론까지 다양한 분야의 발견을 가속했습니다. 최근 결과로는 호흡기 질환 입원 예측과 캘리포니아 하천 유역의 계절별 유출량 예보가 있으며, 관련 코드는 새로 공개된 GitHub 저장소에서 받을 수 있습니다.
Co-Scientist는 Gemini 기반의 다중 에이전트(multi-agent) 시스템으로, 협업하는 AI 파트너로 작동합니다. 이 연구 역시 지난주 Nature에 게재되었으며, 항생제 내성부터 식물 면역, 간 섬유증에 이르는 난제에 연구자들이 어떻게 이 시스템을 활용했는지를 보여줍니다. 아래 영상은 Co-Scientist가 여러 에이전트의 토론을 통해 연구 가설을 다듬어가는 과정을 보여줍니다.
Gemini for Science의 핵심 도구 중 하나인 Computational Discovery는 ERA와 AlphaEvolve로 구축한 에이전트 연구 엔진입니다. 아래 그림처럼 채점 가능한 문제(scorable problem) 와 연구 아이디어를 입력하면, LLM이 코드 샌드박스와 상호작용하며 수천 개의 코드 변형을 병렬로 생성하고 채점합니다. 수작업으로는 몇 달이 걸릴 다수의 가설과 모델링 접근을 빠르게 검증할 수 있습니다.
또 다른 도구인 Hypothesis Generation은 Co-Scientist로 구축되어, 연구 과제를 함께 정의하고 다중 에이전트 아이디어 토너먼트(idea tournament) 를 돌려 가설을 생성, 토론, 평가합니다. 과학적 엄밀성을 위해 모든 주장은 클릭 가능한 인용으로 뒷받침됩니다. Literature Insights는 NotebookLM으로 구축되어 방대한 과학 문헌의 발견을 종합하고 구조화하며, Google Antigravity 같은 플랫폼에서 에이전트 코딩을 하는 연구자라면 Science Skills를 통해 구조 생물정보학이나 유전체 분석 같은 복잡한 워크플로우를 몇 시간이 아닌 몇 분 만에 수행할 수 있습니다.
생태계와의 협력 측면에서, Google은 에이전트 기반 동료 검토(peer review)와 과학적 검증 도구도 시범 운영하고 있습니다. ICML, STOC, NeurIPS 같은 주요 학회가 Paper Assistant Tool(PAT)을 탐색 중이며, 이 도구들은 실험적 역량으로 1만 편 이상의 논문 을 검토해 저자들이 핵심적인 이론적 결함을 찾거나 새로운 실험을 수행하도록 도왔습니다. 한편 Gemini Deep Think는 고급 에이전트 추론으로 수학자, 물리학자, 컴퓨터 과학자와 협업하여 전문가 수준의 미해결 문제들을 풀었습니다. 네트워크의 교착 상태 퍼즐, 10년 묵은 최적화 추측, 머신러닝 최적화 이상 현상, 경매 경제 이론, 우주끈의 물리적 특이점 등이 그 대상이었습니다.
AI로 건강을 진전시키다
Google Research가 오랫동안 투자해 온 또 다른 분야는 헬스케어입니다. 이번 정리에서는 사람들이 증상을 학습하고 진료를 준비하며 의료 기록을 이해하는, 진료 전후를 아우르는 건강 여정 전반을 AI가 어떻게 지원하는지를 다룹니다. 이 기초 연구는 새로운 Google Health 앱과 Google Health Coach를 가능하게 했으며, 지난주부터 기존 Fitbit 사용자 전체로 Google Health 앱 출시가 시작되어 개인 맞춤형 코칭이 제공됩니다.
이 작업은 개인 건강 LLM(personal health LLM)이 수면과 피트니스를 어떻게 도울 수 있는지에 관한 다년간의 연구 위에 서 있습니다. 최신 연구로는 사용자 증상과 관련된 대화 데이터를 추론하는 실험 도구 Symptom AI가 있습니다. Fitbit 앱을 통한 무작위 동의 연구에서 13,917명의 참가자가 실험적 AI 에이전트와 상호작용했고, 블라인드 비교에서 독립 임상의들은 Symptom AI의 감별 진단을 다른 임상의의 진단보다 약 두 배 더 자주 선호했습니다. Plan for Care 시범 연구에서는 1,779명의 참가자가 진료를 준비하는 과정을 살폈는데, 기준 모델 대비 15% 더 많은 사용자가 더 잘 준비되었다고 느꼈고 13% 더 많은 사용자가 진료를 최대한 활용할 자신감을 느꼈습니다.
개인 건강 기록(Personal Health Record, PHR) 연구에서는 모델 컨텍스트에 PHR 데이터를 넣었을 때 답변 품질에 미치는 영향을 평가했습니다. 아래 그래프는 PHR이 없는 경우(No PHR), 기본(Basic), 전체(Full) 세 조건에서 답변 유용성에 대한 평균 평점을 자동 평가자와 임상의 평가자가 각각 매긴 결과입니다. 두 평가자 모두 PHR 컨텍스트가 있을 때 AI 응답이 유의미하게 더 유용하다고 판단했습니다.
임상 환경에서의 AI 활용도 중요한 연구 갈래입니다. 앞선 두 편의 Nature 논문에서 Google Research와 Google DeepMind가 공동 개발한 다중 에이전트 시스템 AMIE가 복잡한 사례를 해석하고 추론할 수 있음을 보였고, 지난주 Nature Medicine 에 게재된 새 연구에서는 병력, 검사 결과, 복잡한 의료 영상을 포함한 멀티모달 데이터를 다루는 역량을 선보였습니다. 실제 환경 검증을 위해 Beth Israel Deaconess Medical Center와 협력하고 있으며, Included Health와는 AI 기반 원격의료를 평가하는 전국 규모의 무작위 연구를 시작했습니다.
글로벌 헬스케어 개발자 생태계를 위해서는 MedGemma를 제공합니다. 이는 Health AI Developer Foundations에 속한 오픈 웨이트(open-weight) 기반 모델로, 멀티모달 의료 텍스트와 임상 추론, 영상 이해에 특화되어 있습니다. 함께 공개된 MedASR은 의료 음성 인식 역량을 제공합니다. MedGemma는 현재까지 500만 회 이상 다운로드되었습니다.
엣지를 위한 에너지 효율 하드웨어: Coralboard와 Coral NPU
소프트웨어뿐 아니라 하드웨어 생태계를 위한 연구도 이어지고 있습니다. Coral NPU는 웨어러블이나 센서 같은 엣지 애플리케이션을 위한 에너지 효율적 AI 가속기 코어입니다. 오픈 하드웨어를 기반으로 검증된 오픈소스 IP로 제공되어 상용 실리콘 통합에 쓸 수 있으며, 엣지 AI 생태계를 가속하는 표준 아키텍처를 만드는 것을 목표로 합니다.
I/O에서는 Synaptics와 협력한 첫 번째 Coralboard가 공개되었습니다. AI/ML 엔지니어와 장비 제조사가 빠르게 시제품을 만들고 기기를 구축할 수 있도록 설계되었으며, Gemma 3 270M 오픈 모델을 탑재하고 카메라와 디스플레이, 마이크 입력, 선택적 Wi-Fi/Bluetooth 연결 등 풍부한 하드웨어 인터페이스를 제공합니다.
이 구현의 위력은 독특한 사전 행사 경험으로 드러났습니다. Coralboard를 몬터레이 베이 아쿠아리움(Monterey Bay Aquarium)에 배치해 해파리의 움직임을 온디바이스로 실시간 감지하고, 그 움직임으로 대형 스크린의 음악과 영상 경험(Jellectronica)을 연출한 것입니다. Synaptics Coralboard는 올여름 후반에 정식 출시될 예정입니다.
극한 기상 예측: WeatherNext와 도시 홍수 예보
열대성 저기압과 홍수 같은 자연재해는 지역사회를 파괴하고 생명을 위협합니다. Google은 오랜 위기 대응(crisis resilience) 노력의 일환으로 AI 기반 기상 예측을 통해 전 세계 지역사회가 위기에 대비하도록 돕고 있습니다.
지난해 Google은 WeatherNext 모델의 저기압 예측으로 미국 국립허리케인센터(National Hurricane Center)의 예보를 지원하는 파트너십을 발표했습니다. I/O에서는 2025년 10월 허리케인 멜리사(Melissa)가 접근할 때 WeatherNext가 급격한 강화와 자메이카 상륙을 5일 전에 높은 신뢰도로 예측했음을 소개했습니다. 덕분에 자메이카 기상청이 사전에 대중에게 경보를 발령할 수 있었습니다. (
WeatherNext에 대한 더 깊은 배경은 PyTorchKR의 Weather Lab 소개 글에서 확인하실 수 있습니다.)
또 다른 성과는 도시 돌발 홍수 예측입니다. 데이터 부족이라는 난제를 풀기 위해 Google은 Groundsource를 도입했는데, 이는 Gemini를 활용해 20년치의 비정형 공개 뉴스 보도를 260만 건의 고품질 데이터셋으로 전환하는 확장 가능한 방법론입니다. 이 데이터로 도시 돌발 홍수 예측 모델을 학습시켰으며, 예보는 하천 홍수 예보와 함께 Flood Hub에서 제공됩니다. 현재 150개국 20억 명을 대상으로 주요 홍수 사례를 다룹니다.
WeatherNext와 홍수 예보 모델은 Google Earth AI의 일부입니다. 이는 지리공간 모델과 데이터셋 모음으로, 도로 관리, 인구 동태, 위성 인사이트 등으로 행성 규모의 정보를 실행 가능한 인텔리전스로 전환합니다.
Gemini의 핵심 역량 강화: 사실성, 다국어, 추론 속도
Google Research는 Gemini의 품질과 성능을 끌어올리는 기초 연구를 꾸준히 이어가고 있습니다. 사실성(Factuality), 다국어성(Multilinguality), 효율성(Efficiency) 세 축이 그 중심입니다.
LLM 사실성에 대한 연구는 2021년 지식 기반 대화의 사실 일관성 평가와 2022년 초기 벤치마크로 거슬러 올라갑니다. 이후 Google은 FACTS를 공개하고 이를 확장하여 LLM 사실성을 견고하게 벤치마킹할 수 있게 했으며, 텍스트-이미지, 영상 생성, 긴 컨텍스트, 불확실성 표현에서 사실성을 높이는 기법들을 발표했습니다. 사용자가 더 긴 대화를 통해 원하는 정보를 얻는 흐름이 늘면서, 컨텍스트 윈도우 안에서 더 많은 정보를 추론하고 대화 초반의 제약을 지키며 더 긴 강화 학습(Reinforcement Learning) 궤적을 활용하는 역량이 중요해졌습니다. 새 Ask Maps와 Ask YouTube 기능이 이러한 연구의 직접적인 수혜를 받았습니다.
다국어성 측면에서는 LLM이 여러 언어에서 어떻게 작동하는지 보여주는 벤치마크를 발표하고, 아프리카 언어 데이터를 오픈소스로 공개했습니다. 이러한 노력으로 Gemini는 230개국 이상에서 70개 이상의 언어를 지원하는, 세계에서 가장 널리 사용 가능한 AI 어시스턴트가 되었습니다.
효율성 측면에서는 추측 디코딩(speculative decoding)을 기반으로 한 블록 검증(block verification)과 트리 구조 드래프팅 기법을 개발했습니다. 여러 후보 연속 토큰을 한 번에 탐색하고 스텝당 더 많은 토큰을 수용하는 방식으로, Google의 TPU 아키텍처에 고도로 최적화되어 품질 손실 없이 응답 속도를 크게 높였습니다. 이 작업이 Gemini 3.5 Flash의 현재 속도를 가능하게 했으며, 같은 모델이 Antigravity와 AI Studio도 구동합니다.
더 몰입감 있는 생성형 경험: 생성형 UI와 Gemini Omni
생성형 UI(generative UI)에 대한 연구는 검색과 Gemini 앱의 새로운 몰입형 경험의 토대가 되었습니다. 검색에서는 질문에 맞는 형식으로 시뮬레이션, 그래프, 트래커, 대시보드 같은 맞춤형 응답을 구성할 수 있고, Gemini에서는 인터랙티브 이미지, 타임라인, 임베드된 영상을 볼 수 있습니다.
생성형 영상과 이미지 품질에 대한 수요가 늘면서, Google Research는 Google DeepMind와 협력해 어떤 입력으로든 무엇이든 만들어내는 새 모델 Gemini Omni의 개선에 기여했습니다. 특히 생성된 영상 클립의 스토리텔링 요소와 인물 표정 품질을 높이는 데 집중했습니다.
개발자 생산성의 새 시대: Antigravity 2.0와 Gemma V4
I/O에서 공개된 Google Antigravity 2.0은 여러 로컬 에이전트를 병렬로 관리하고 작업을 자동화하는 개선된 에이전트 개발 플랫폼입니다. Google은 새 Flash 모델 위에서 작동하는 /teamwork-preview 에이전트를 도입해, 에이전트들이 복잡하고 긴 호흡의 소프트웨어 및 ML 엔지니어링 작업을 수행할 수 있음을 보였습니다. /teamwork-preview 워크플로우는 사용자 프롬프트를 다듬는 에이전트를 호출하고, 사용자 승인 후 오케스트레이터가 수십 개의 전문 하위 에이전트를 생성해 코드를 작성, 테스트, 디버깅합니다. I/O에서는 이 다중 에이전트 시스템이 스케줄러부터 메모리 관리, 파일 시스템까지 모든 코드를 자율적으로 작성해 운영체제를 처음부터 구축하는 데모를 선보였습니다. 이 외에도 AlphaZero 논문을 구현하고 셀프 플레이(self-play)로 바둑 에이전트를 학습시키는 데모도 함께 공개되었습니다. 아래 영상은 에이전트 팀이 자율적으로 코드를 작성하는 데모 장면입니다.
(
Antigravity로의 전환 배경은 PyTorchKR의 Gemini CLI 종료와 Antigravity CLI 전환 글에서 자세히 다룹니다.)
오픈소스와 공개 데이터셋은 현대 과학의 동력입니다. Google은 MedGemma 같은 오픈 모델과 Groundsource 같은 공개 데이터셋을 통해 혁신이 전 세계로 확산되도록 합니다. 지난 4월에는 추론, 코딩, 에이전트 워크플로우를 위해 설계된 가장 진보한 오픈 모델 Gemma V4를 오픈소스로 공개했으며, I/O에서는 Gemma V4가 단 한 달 만에 1억 다운로드를 넘었다고 발표했습니다. (
Gemma 4에 대한 상세 내용은 PyTorchKR의 Gemma 4 공개 정리 글을 참고해주세요.)
새로운 프라이버시와 데이터 보호 기술
에이전트가 사용자를 대신해 쇼핑과 결제를 하고 스마트 안경이 어디서나 사용자를 안내하는 세상에서, 사용자 신뢰를 얻고 유지하는 일은 무엇보다 중요합니다. Google은 수년간 프라이버시 보존 기술(Privacy-Preserving Technology, PPT) 을 개발해 왔습니다. PPT는 집계되고 익명화된 데이터에서 인사이트를 도출하면서도 개인의 프라이버시를 강하게 보장합니다.
최근의 프라이버시 혁신으로는 사람들이 챗봇과 온디바이스 AI를 어떻게 사용하는지에 대한 프라이버시 보존 집계 인사이트가 있으며, 머신러닝을 위한 차분 프라이버시(differential privacy), LLM, 파티션 선택, 합성 데이터 생성의 근본 기법도 개선했습니다. 특히 세계에서 가장 강력한 차분 프라이버시 LLM이라 소개된 VaultGemma가 주목할 만합니다.
양자 컴퓨팅을 선도하다: Willow와 Quantum Echoes
Google은 양자 컴퓨팅 로드맵을 따라 실제 응용에 한 걸음씩 다가가고 있습니다. 초전도 큐비트(superconducting qubit) 개발을 선도하며 오류 정정과 검증 가능한 양자 우위(verifiable quantum advantage) 같은 이정표를 달성했습니다.
Nature 에 게재된 Willow 칩 연구에서 Google은 검증 가능한 양자 우위를 달성한 역사상 최초의 알고리즘을 시연했습니다. 시간 순서를 벗어난 시간 상관자(out-of-time-order correlator, OTOC) 알고리즘을 실행한 이 성과를 Quantum Echoes라 부르는데, Willow에서 세계 최고 수준의 슈퍼컴퓨터에서 돌린 최고의 고전 알고리즘보다 13,000배 빠르게 동작했습니다. 또한 올해 초에는 개별 원자를 큐비트로 사용하는 중성 원자 양자 컴퓨팅(neutral atom quantum computing)으로 연구를 확장했습니다.
I/O 무대에서 James Manyika와 Hartmut Neven은 양자 컴퓨팅과 AI의 교차점을 논의했습니다. AI는 칩 설계부터 더 나은 오류 정정까지 양자 컴퓨팅의 진보를 이미 가속하고 있고, 반대로 양자 컴퓨팅은 자연이 근본 수준에서 작동하는 방식을 고전 계산보다 더 정확히 탐구함으로써 AI를 더 효과적으로 만들 잠재력이 있습니다. 지난주 Google은 생명과학에 양자 과학과 AI를 적용하기 위해 5개 대학에 1,000만 달러를 투입하는 생명과학과 양자 AI의 교차점 연구 프로그램(REPLIQA)을 출범했습니다.
결론: 연구에서 현실로 이어지는 매직 사이클
I/O 2026에서 공유된 성과들은 하나의 공통된 메시지를 담고 있습니다. 기초 연구가 연구에서 현실로(research to reality) 이어지며 제품과 과학, 사회에 실질적 영향을 미친다는 것입니다. ERA와 Co-Scientist가 Nature 논문에서 출발해 Gemini for Science의 실험 도구가 되고, 추측 디코딩 연구가 Gemini 3.5 Flash의 속도가 되며, Willow 칩의 양자 우위가 생명과학 연구 프로그램으로 확장되는 흐름이 그 예입니다.
개발자와 연구자 관점에서 이번 정리가 시사하는 바는 분명합니다. 단일 모델의 성능 경쟁을 넘어, 여러 에이전트가 협업하며 가설을 세우고 코드를 작성하고 검증하는 에이전트 워크플로우 가 연구와 개발의 기본 단위가 되어가고 있다는 점입니다. 이 글에서 다룬 각 분야는 그 자체로 깊이 들어갈 가치가 있으며, 관심 있는 주제의 원문 링크를 따라가며 더 깊이 탐색해보시기를 권합니다.
A New Era of Innovation: Google Research at I/O 2026 원문 블로그
더 읽어보기
-
Google I/O 2026 주요 발표 정리: Gemini 3.5 Flash와 24/7 에이전트 Gemini Spark, 스마트 안경 등
-
Google, Gemini 3에 이은 Gemini 3 Deep Think 및 Gemini 3.1 Pro 출시
-
Google DeepMind, 모바일 기기부터 클라우드까지 사용 가능한, 통합 멀티모달 모델 Gemma 4 공개
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. ![]()
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ ![]()




