[GN] Google I/O 2024에서 발표된 모든 것들

Google I/O 2024에서 발표된 모든 것들

[GN] Google I/O 2024에서 발표된 모든 것들

Gemini 1.5 Flash 모델 발표

  • Gemini 1.5 Pro만큼 강력하지만, 좁고 빈번하며 지연 시간이 짧은 작업에 최적화된 새로운 다중 모달 모델
  • 빠른 응답 생성에 더 적합함
  • Gemini 1.5의 번역, 추론, 코딩 능력도 개선
  • Gemini 1.5 Pro의 컨텍스트 윈도우(흡수할 수 있는 정보량)가 100만 토큰에서 200만 토큰으로 두 배 증가

Project Astra: Google의 Star Trek AI 미래상

  • 다중 모달 AI 어시스턴트로, 기기의 카메라를 통해 보고 이해하며, 사물의 위치를 기억하고, 사용자를 대신해 작업을 수행하는 것을 목표로 함
  • 올해 I/O에서 가장 인상적인 데모 대부분에 적용됨
  • 단순히 대화하는 것을 넘어 실제로 사용자를 대신해 작업을 수행하는 진정한 AI 에이전트가 되는 것이 목표임

Veo: Google의 Sora 스타일 동영상 생성

  • OpenAI의 Sora에 대응하는 Google의 새로운 생성형 AI 모델로, 텍스트, 이미지, 동영상 기반 프롬프트를 사용하여 1080p 동영상을 출력할 수 있음
  • 항공 촬영이나 타임랩스 등 다양한 스타일로 동영상을 제작할 수 있으며, 추가 프롬프트로 조정 가능함
  • 일부 크리에이터에게 YouTube 동영상 제작에 사용할 수 있도록 제공되고 있으며, 영화 제작에도 활용 가능함을 피치하고 있음

Gemini의 Workspace 통합

  • 차세대 언어 모델인 Gemini 1.5 Pro가 Docs, Sheets, Slides, Drive, Gmail의 사이드바에 통합됨
  • 다음 달 유료 구독자에게 제공될 예정이며, Workspace 내에서 범용 어시스턴트 역할을 수행함
  • Drive의 모든 콘텐츠에서 정보를 가져올 수 있음
  • 현재 보고 있는 문서의 정보를 통합하여 이메일을 작성하거나, 나중에 읽고 있는 이메일에 응답하라고 알려주는 등의 작업을 수행할 수 있음

Google Lens의 기능 확장

  • 이미지뿐만 아니라 비디오로도 검색 가능해짐
  • 비디오를 촬영하면서 질문을 하면 Google의 AI가 웹에서 관련 답변을 찾아주는 기능이 추가됨

Gemini의 Google Photos 활용

  • 올 여름 출시 예정인 "Ask Photos" 기능을 통해 사용자의 Google Photos 라이브러리를 분석하여 질문에 답변해줌
  • 단순히 개나 고양이 사진을 찾아주는 것을 넘어서, CEO인 Sundar Pichai가 시연한 것처럼 자신의 차량 번호판 번호를 묻는 등의 복잡한 질문에도 답변이 가능함

Gems: Gemini에 맞춤형 챗봇 생성 기능 추가

  • OpenAI의 GPT와 마찬가지로, Gems를 통해 사용자가 Gemini에게 지시를 내려 응답 방식과 전문 분야를 커스터마이징할 수 있음
  • 예를 들어, 매일 동기 부여와 달리기 계획을 제공하는 긍정적이고 끈질긴 달리기 코치를 원한다면 곧 가능해질 예정 (Gemini Advanced 구독자의 경우)

Gemini의 대화 능력 향상

  • 새로운 Gemini Live 기능은 Gemini와의 음성 채팅을 더 자연스럽게 만드는 것을 목표로 함
  • 챗봇의 목소리에 개성이 더해지고, 사용자는 중간에 말을 끊거나 스마트폰 카메라를 통해 실시간으로 정보를 제공하도록 요청할 수 있음
  • Gemini는 Google Calendar, Tasks, Keep과 통합되어 정보를 업데이트하거나 가져올 수 있으며, 전단지의 세부 정보를 개인 캘린더에 추가하는 등 다중 모달 기능을 활용함

Circle to Search의 수학 문제 해결 지원

  • 이제 Android 폰이나 태블릿에서 수학 문제를 동그라미 치면 문제 해결에 도움을 받을 수 있음
  • Google의 AI는 학생들이 숙제를 속이는 데 도움이 되지 않도록 문제를 직접 풀어주지는 않지만, 단계별로 분해하여 완료하기 쉽게 만들어 줌

Google 검색의 AI 개편

  • 이번 주 미국 전역에 "AI Overviews"(이전에는 "Search Generative Experience"라고 불림)가 출시될 예정임
  • 이제 "전문화된" Gemini 모델이 검색 결과 페이지를 설계하고 웹에서 요약된 답변으로 채울 것임 (Perplexity나 Arc Search와 같은 AI 검색 도구에서 볼 수 있는 것과 유사함)

Android의 AI 기반 사기 탐지

  • Google은 기기 내 Gemini Nano AI를 사용하여 Android 폰이 사기꾼의 일반적인 대화 패턴 등 위험 신호를 감지하고 실시간 경고를 표시하여 사기 전화를 피하는 데 도움을 줄 수 있다고 함
  • 이 기능에 대한 자세한 내용은 올해 말 제공될 예정임

Android 기기의 AI 지능 향상

  • Google은 Gemini가 곧 사용자가 화면에 표시된 동영상에 대해 질문할 수 있도록 하고, 자동 자막을 기반으로 답변할 것이라고 밝힘
  • 유료 Gemini Advanced 사용자의 경우 PDF도 흡수하여 정보를 제공할 수 있음
  • Gemini on Android에 대한 이러한 다중 모달 업데이트와 기타 업데이트는 향후 몇 달 동안 제공될 예정임

Google Chrome에 AI 어시스턴트 추가

  • Google은 데스크톱의 Chrome에 경량 버전인 Gemini Nano를 추가한다고 발표함
  • 내장된 어시스턴트는 기기 내 AI를 사용하여 Google Chrome 내에서 직접 소셜 미디어 게시물, 제품 리뷰 등을 위한 텍스트 생성을 도와줄 것임

SynthID AI 워터마킹 업그레이드

  • Google은 SynthID의 기능을 확장한다고 밝힘
  • 새로운 Veo 동영상 생성기로 생성된 콘텐츠에 워터마킹을 삽입할 것이며, 이제 AI 생성 동영상도 감지할 수 있게 됨

원문

출처 / GeekNews

더 읽어보기


:information_source: 알려드립니다

이 글은 국내외 IT 소식들을 공유하는 GeekNews의 운영자이신 xguru님께 허락을 받아 GeekNews에 게제된 AI 관련된 소식을 공유한 것입니다.

출처의 GeekNews 링크를 방문하시면 이 글과 관련한 추가적인 의견들을 보시거나 공유하실 수 있습니다! :wink:

:gift: 아래:arrow_lower_right:쪽에 좋아요:heart:를 눌러주시면 새로운 소식을 정리하고 공유하는데 힘이 됩니다~ :star_struck:

1개의 좋아요