PyTorchKR이 정리한 오늘의 주요 AI/ML 소식들 @ 2023-12-12: StripedHyena-7B, Zephyr-3B, FollowMe 등

파이토치 한국 사용자 모임이 한땀한땀 정리한 오늘의 주요 AI/ML 소식들을 전해드립니다.

StripedHyena-7B: TogetherAI에서 출시한 최신 AI 모델

100배 속도 향상을 목표로, 트랜스포머의 추론 최적화 기법 소개

  • 트랜스포머 구조에서의 추론을 최적화하기 위해 전체적인 기술 스택에 대해서 다루고 있습니다:
    NVIDIA의 A100 메모리 계층 구조와 같은 GPU 하드웨어 사양부터 FlashAttention, vLLM 같은 MLSys 방법론, 모델 아키텍처(Mixture of Experts), 디코딩 알고리즘(Speculative Decoding 및 그 변형) 등에서의 최적화를 통해 트랜스포머 추론의 규모를 확장하고 속도를 높일 수 있습니다.

  • 더 읽어보기

Stable LM Zephyr 3B: Stable AI가 공개한 에지 디바이스용 LLM 어시스턴트

FollowMe: 로봇이 사용자를 식별(ReID)하고 따라가며 명령어를 수행하는 프레임워크


오늘의 주요 소식이 유용하셨나요?

아래:down_right_arrow:쪽에 좋아요:heart:를 눌러주시면 뉴스 발행에 힘이 됩니다~ :bowing_man:

1개의 좋아요