|
GDPval: OpenAI가 공개한, 실무 중심의 AI 성능 평가를 위한 프레임워크
|
|
0
|
275
|
9월 28, 2025
|
|
Embedding Explorer: 로컬 데이터를 사용하여 여러가지 임베딩 모델들을 평가하고 비교하는 오픈소스
|
|
0
|
195
|
9월 26, 2025
|
|
LLM Optimizer: 다양한 LLM의 추론 성능을 벤치마킹하고 최적화하는 도구 (feat. BentoML)
|
|
0
|
262
|
9월 12, 2025
|
|
IntellAgent: 대화형 AI 시스템 평가를 위한 다중 에이전트 프레임워크(Multi-Agents Framework)
|
|
0
|
281
|
1월 23, 2025
|
|
AgentOps, AI 에이전트의 신뢰성과 효율성을 강화하기 위한 포괄적인 도구
|
|
0
|
679
|
11월 27, 2024
|
|
Laminar: AI Agent나 RAG와 같은 복잡한 LLM 애플리케이션을 위한 오픈소스 관측 및 분석 플랫폼 (feat. OpenLLMetry)
|
|
0
|
351
|
9월 5, 2024
|
|
Promptfoo, LLM 애플리케이션 평가 및 테스트 도구
|
|
0
|
1056
|
6월 28, 2024
|
|
Paramount: AI 대화 평가 도구
|
|
0
|
263
|
6월 15, 2024
|
|
PromptTools: LLM, VectorDB, Prompt 실험 및 테스트를 위한 오픈소스 도구
|
|
0
|
557
|
3월 21, 2024
|