Elon Musk의 X.ai, Grok-1.5 Vision 출시

:pytorch:PyTorchKR:kr:

  • 얼마 전 Grok-1을 Open Source로 공개한 뒤, 이미지를 입력으로 받는 멀티모달 모델인 Grok-1.5V를 출시하였습니다. 아직 X(Twitter)의 Premium 요금제 사용자들에게만 제공되는 것 같습니다. (시험삼아 Premium 요금제에 가입해봤는데... 한국은 아직 지원 국가가 아닌 것 같습니다. :sob:) Grok-1.5V는 텍스트 처리뿐만 아니라 문서, 다이어그램, 차트, 스크린샷, 사진 등 시각적 정보에 대해서도 뛰어난 성능을 보인다고 하는데요, 함께 살펴보시죠. :astonished:


Elon Musk의 X.ai, Grok-1.5 Vision 출시

소개

Grok-1.5V는 텍스트 능력 뿐만 아니라, 시각적 정보 처리에 있어서도 뛰어난 성능을 보여주는 첫 번째 세대의 멀티모달 모델입니다. 이 모델은 조만간 초기 테스터와 기존 Grok 사용자들에게 제공될 예정이며, 이는 AI 기술의 새로운 지평을 열 것으로 기대됩니다.

Grok-1.5V는 다른 모델들과의 비교에서도 우수한 성능을 보여줍니다. 예를 들어, 다른 AI 모델들과 비교했을 때, 다양한 벤치마크에서의 점수는 Grok-1.5V가 특히 실세계 이해에서 높은 평가를 받고 있음을 보여줍니다.

Grok-1.5V는 다양한 벤치마크에서 기존의 최전선 멀티모달 모델들과 경쟁할 수 있는 성능을 가지고 있습니다. 특히, 실제 세계를 이해하는 능력에서 두각을 나타내며, 새로 개발된 RealWorldQA 벤치마크에서는 공간 이해 능력을 평가합니다. 이 벤치마크에서 Grok-1.5V는 동료 모델들을 뛰어넘는 성과를 보여주었습니다.

사용 예시

Grok-1.5V는 텍스트와 이미지를 포함한 다양한 입력을 처리할 수 있으며, 사용자는 간단한 코드를 통해 이 모델을 활용할 수 있습니다. 예를 들어, 다음과 같은 플로우 차트를 그린 화이트보드 이미지를 입력으로 주어졌다고 가정해보겠습니다:

Grok-1.5V 사용 예: 화이트보드에 작성된 플로우차트

Grok-1.5는 위와 같은 이미지 내의 플로우차트를 기반으로 다음과 같이 동작합니다:

:question: User: Can you translate this into Python code?
:robot: Grok: Certainly! The flowchart you’ve provided describes a simple guessing game where the computer generates a random number, and the user has to guess it. Here’s the Python code that represents the logic in the flowchart:

import random

def guess_number(): # Generate a random number between 1 and 10

    target = random.randint(1, 10)

    while True:
        guess = int(input("Guess a number between 1 and 10: "))

        if guess == target:
            print("You won!")
            break
        else:
            print("Wrong guess, try again!")

if __name__ == "__main__":
    guess_number()

This code will run the guessing game as described in the flowchart. The user will be prompted to enter their guess until they guess the correct number.

더 읽어보기




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:kr:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:gift: 아래:arrow_lower_right:쪽에 좋아요:heart:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck: