[GN] PowerInfer - 소비자용 GPU를 사용해서 빠르게 LLM 서빙하기
|
|
0
|
673
|
12월 21, 2023
|
Streaming-LLM: 어텐션 싱크(attention sink)로 효율적인 언어 모델 스트리밍 (Efficient Streaming Language Models with Attention Sinks)
|
|
0
|
1354
|
10월 4, 2023
|
[GN] TII, Falcon-180B 모델 공개
|
|
0
|
407
|
9월 7, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-06-06: 애플 WWDC의 AI🍎, 🤗허깅페이스 - 양자화된 LLM을 효율적으로 미세조정하는 팔콘🦅 출시🧰
|
|
1
|
835
|
12월 31, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-06-02: OpenAI의 100만달러 AI 보안 보조금💰, 바이두의 AI 벤처 펀드💸, 말하는 3D 얼굴 생성 😃
|
|
1
|
404
|
12월 31, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-06-01: 바이든 행정부의 AI 규제🏛️, AI 모델을 더 작게 만들려는 경쟁🤏, OpenAI - "프로세스 감독" 도입🦺
|
|
1
|
514
|
12월 31, 2023
|