Humbug: 여러 모델을 사용할 수 있는 AI 중심의 오픈소스 개발 도구
|
|
0
|
201
|
1월 22, 2025
|
Moonlight: 연구자들을 위한 논문 AI PDF 뷰어
|
|
0
|
838
|
1월 9, 2025
|
Semantic Reader: AI를 활용한 논문 읽기 도구 (feat. AI2)
|
|
2
|
525
|
10월 23, 2024
|
[2024/08/19 ~ 08/25] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
616
|
8월 26, 2024
|
[GN⁺] Postgres.new: AI 인터페이스를 갖춘 브라우저 내 Postgres
|
|
0
|
140
|
8월 14, 2024
|
[GN⁺] RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크
|
|
0
|
352
|
7월 12, 2024
|
AI 알리바이(AI Alibis): LLM 및 멀티 에이전트 기반의 텍스트 기반 추리 게임
|
|
0
|
215
|
7월 12, 2024
|
OpenPipe, MoA 기법 활용하여 25배 낮은 가격으로 GPT-4 성능을 뛰어넘는 모델 제공
|
|
0
|
692
|
6월 21, 2024
|
TokenCost: LLM 애플리케이션을 위한 사용 토큰 계산 및 비용 추정 도구
|
|
0
|
553
|
6월 18, 2024
|
Paddler, llama.cpp 서버 최적화를 위한 오픈소스 로드 밸런서
|
|
0
|
241
|
6월 14, 2024
|
LlamaNet: 1~2줄의 코드 변환만으로 OpenAI 기반 애플리케이션을 llama.cpp 기반 로컬 모델로 쉽게 변경 가능한 라이브러리
|
|
0
|
340
|
6월 12, 2024
|
[GN] 1년 동안 LLM과 함께 구축하며 배운 점
|
|
0
|
1361
|
6월 11, 2024
|
대규모 언어 모델을 위한 검색-증강 생성(RAG) 기술 현황 - 1/2편
|
|
9
|
13706
|
6월 3, 2024
|
구조화된 출력에서 환각 현상을 줄이기 위한 RAG (feat. ServiceNow)
|
|
0
|
565
|
5월 25, 2024
|
2024년 LLM 모델 개발 트렌드 관련 영상 [영어/유튜브]
|
|
3
|
2235
|
5월 22, 2024
|
LLM 상용화 시, 비용을 낮추면서 성능 향상을 위한 3가지 전략 (feat. FrugalGPT by Portkey)
|
|
0
|
669
|
5월 4, 2024
|
OpenLIT: OpenTelemetry 기반 생성형 AI 및 LLM 모니터링 도구
|
|
0
|
335
|
5월 2, 2024
|
AI에 관심이 있는 개발자라면 Embedding(임베딩)부터 시작해보세요! 😉
|
|
0
|
941
|
4월 18, 2024
|
상용 수준의 LLM 애플리케이션 구축하기 (무료/영어/온라인)
|
|
2
|
257
|
3월 5, 2024
|
[GN] Menlo Ventures가 공개한 최신 AI 스택 : 기업용 AI의 미래를 위한 설계 원칙
|
|
0
|
369
|
1월 31, 2024
|
RadixAttention과 SGLang을 활용한 LLM 프로그래밍 혁신 (feat. LMSYS)
|
|
0
|
1418
|
1월 20, 2024
|
[GN⁺] 스마트 홈 제어를 위한 완전 로컬 LLM 음성 비서 구축하기
|
|
0
|
661
|
1월 15, 2024
|
메두사: 여러 디코딩 헤더를 사용한 대규모 언어 모델 추론 가속화 프레임워크 (Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads)
|
|
0
|
1008
|
12월 26, 2023
|
LongLLMLingua: 중간 손실을 줄이고 프롬프트 압축을 통한 RAG 비용 절감 (LongLLMLingua: Bye-bye to Middle Loss and Save on Your RAG Costs via Prompt Compression
|
|
0
|
941
|
12월 22, 2023
|
[GN] Microsoft (Long)LLMLingua - 추론 가속 및 비용 절감을 위해 프롬프트 압축하기
|
|
0
|
444
|
12월 22, 2023
|
[GN] PowerInfer - 소비자용 GPU를 사용해서 빠르게 LLM 서빙하기
|
|
0
|
695
|
12월 21, 2023
|
PyTorchKR이 정리한 오늘의 주요 AI/ML 소식들 @ 2023-12-12: StripedHyena-7B, Zephyr-3B, FollowMe 등
|
|
1
|
376
|
12월 31, 2023
|
상용 수준의 LLM 애플리케이션을 위한 개발자 가이드(The Developer's Guide to Production-Grade LLM Apps)
|
|
0
|
5259
|
11월 24, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-11-22: 샘 알트먼이 OpenAI에 복귀 👋, 스테이블 비디오 📹, Go 언어로 랭체인 🦜
|
|
1
|
298
|
12월 31, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-11-17: 딥마인드 및 유튜브 음악 합성 🎵, 메타 비디오 편집 모델 🎬, 마이크로소프트 딥페이크 크리에이터 😶🌫️
|
|
1
|
284
|
12월 31, 2023
|