주제에 evaluation-tool 태그가 달렸습니다

글	조회수	활동
The LLM Evaluation Guidebook: Hugging Face가 공개한 LLM 평가를 위한 종합적이고 실질적인 안내서 읽을거리&정보공유 huggingface , guide , llm-evaluation , benchmark , evaluation-framework , evaluation-tool , llm-benchmark , llm-evaluation-guidebook , evaluation-datasets	27	12월 9, 2025
GDPval: OpenAI가 공개한, 실무 중심의 AI 성능 평가를 위한 프레임워크 읽을거리&정보공유 openai , llm-evaluation , evaluation-framework , evaluation-tool , gdpval , llm-in-work	342	9월 28, 2025
Embedding Explorer: 로컬 데이터를 사용하여 여러가지 임베딩 모델들을 평가하고 비교하는 오픈소스 읽을거리&정보공유 embedding , evaluation-tool , webapp , embedding-explorer , embedding-comparison	215	9월 26, 2025
LLM Optimizer: 다양한 LLM의 추론 성능을 벤치마킹하고 최적화하는 도구 (feat. BentoML) 읽을거리&정보공유 evaluation-tool , llm-benchmark , bentoml , llm-optimizer	292	9월 12, 2025
IntellAgent: 대화형 AI 시스템 평가를 위한 다중 에이전트 프레임워크(Multi-Agents Framework) 읽을거리&정보공유 llm-agent , multi-agent , agent-framework , evaluation-tool , multi-agent-framework , intellagent , plurai-ai	289	1월 23, 2025
AgentOps, AI 에이전트의 신뢰성과 효율성을 강화하기 위한 포괄적인 도구 읽을거리&정보공유 evaluation-tool , ai-agent , agentops , debugging-tool	745	11월 27, 2024
Laminar: AI Agent나 RAG와 같은 복잡한 LLM 애플리케이션을 위한 오픈소스 관측 및 분석 플랫폼 (feat. OpenLLMetry) 읽을거리&정보공유 llm-framework , observability , openllmerty , evaluation-tool , laminar , llm-analytics , lmnr-ai , lmnr	363	9월 5, 2024
Promptfoo, LLM 애플리케이션 평가 및 테스트 도구 읽을거리&정보공유 tool , opensource , llm-evaluation , llm-applications , llm-testing , mit-license , evaluation-tool , promptfoo	1140	6월 28, 2024
Paramount: AI 대화 평가 도구 읽을거리&정보공유 opensource , llm-evaluation , evaluation-tool , paramount , gpl-license	265	6월 15, 2024
PromptTools: LLM, VectorDB, Prompt 실험 및 테스트를 위한 오픈소스 도구 읽을거리&정보공유 tool , prompt-engineering , vector-db , llm-evaluation , prompttools , evaluation-tool	562	3월 21, 2024

The LLM Evaluation Guidebook: Hugging Face가 공개한 LLM 평가를 위한 종합적이고 실질적인 안내서

huggingface , guide , llm-evaluation , benchmark , evaluation-framework , evaluation-tool , llm-benchmark , llm-evaluation-guidebook , evaluation-datasets