[GN] 구글, AI 모델 Gemini 공개

GeekNewsxguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. :smiley_cat:


소개

  • MMLU에서 90%를 받아 인간 전문가를 능가한 최초의 AI 모델 Gemini(제미나이)

  • 멀티모달 AI 모델로 이미지/비디오/오디오 다중 모드 벤치마크에서도 GPT-4V 와 Whisper 를 능가

A chart showing Gemini Ultra’s performance on common text benchmarks, compared to GPT-4 (API numbers calculated where reported numbers were missing).
A chart showing Gemini Ultra’s performance on multimodal benchmarks compared to GPT-4V, with previous SOTA models listed in places where capabilities are not supported in GPT-4V.

  • 3가지 모델로 크기에 따른 최적화

    • Ultra : 복잡한 작업을 위한 가장 크고 뛰어난 모델

    • Pro : 광범위한 작업에 걸쳐 확장 가능

    • Nano : 온디바이스 작업을 위한 가장 효율적인 모델

  • Python, Java, C++, Go 등 세계에서 가장 널리 사용되는 프로그래밍 언어로 고품질 코드를 이해하고 설명하며 생성

  • Gemini 를 이용한 Competitive Programming용 AlphaCode 2도 출시

  • TPU v4 및 v5e를 사용하여 AI에 최적화된 인프라에서 Gemini 1.0을 대규모로 학습

    • 더욱 안정적이고 확장 가능하며 효율적
  • Responsibility 와 Safety에 중점을 둠

  • Gemini Pro는 Google Bard에서 바로 사용 가능

    • 영어로 170개국에서 사용가능하며, 다른 모달리티와 새로운 언어를 곧 지원 예정
  • Gemini Nano를 Pixel 8 Pro에 도입할 것

  • 몇 달 내로 생성형 검색(SGE), 광고, 크롬 및 Duet AI에도 Gemini를 적용할 것

  • 12월 13일 부터 개발자와 기업고객들은 Google AI Studio 및 Google Cloud Vertex AI를 통해서 Gemini API 이용가능(Pro만)

  • Gemini Ultra 도 곧 사용 가능

    • 신뢰할 수 있는 외부 기관의 레드팀 검증을 포함한 광범위한 신뢰 및 안전 점검을 완료하고 있으며, 광범위한 공개를 앞두고 미세 조정과 사람 피드백을 통한 강화 학습(RLHF)을 통해 모델을 더욱 정교하게 다듬는 중

    • 일부 고객, 개발자, 파트너, 안전 및 책임 전문가에게 Gemini Ultra를 제공하여 초기 실험과 피드백을 받은 후 내년 초에 개발자와 기업 고객에게 공개할 예정

    • 내년 초에는 Gemini Ultra를 시작으로 최고의 모델과 기능을 이용할 수 있는 새로운 최첨단 AI 환경인 바드 어드밴스드(Bard Advanced)도 출시할 예정

소개 영상

소개 영상

정교한 추론 / Sophisticated reasoning

텍스트, 이미지, 오디오 등의 이해 / Understanding text, images, audio and more

고급 코딩 / Advanced coding

Gemini 실습: 멀티모달 AI와의 상호 작용 / Hands-on with Gemini: Interacting with multimodal AI

원문

Gemini 소개 글

Gemini Collection

Google Deepmind의 소개 글

Gemini Technical Paper

출처 / GeekNews

Gemini 관련 링크 모음

Gemini + AlphaCode 2

Welcome to the Gemini era

Introducing Gemini: our largest and most capable AI model

Testing Gemini: Finding connections

Hands-on with Gemini: Interacting with multimodal AI

Gemini: Google’s newest and most capable AI model

Testing Gemini: Turning images into code

Testing Gemini: Emoji Kitchen

Gemini: All you need to know in 90 seconds

Testing Gemini: Understanding environments

Gemini: Explaining reasoning in math and physics

Gemini: Excelling at competitive programming

Testing Gemini: Fit check

Gemini: Processing and understanding raw audio

Testing Gemini: Guess the movie

Mark Rober takes Bard with Gemini Pro for a test flight

Gemini: Safety and responsibility at the core

Gemini: Reasoning about user intent to generate bespoke experiences

Gemini: Unlocking insights in scientific literature

Using AI to Improve Students writing skills Quill.org x Google.org

Availability

Google Updates Bard Chatbot With ‘Gemini’ A.I. as It Chases ChatGPT (NYT)

Google DeepMind's Demis Hassabis Says Gemini Is a New Breed of AI

Google launches Gemini, the AI model it hopes will take down GPT-4