evaluation-framework
| 글 | 댓글 | 조회수 | 활동 | |
|---|---|---|---|---|
| The LLM Evaluation Guidebook: Hugging Face가 공개한 LLM 평가를 위한 종합적이고 실질적인 안내서 |
|
0 | 26 | 12월 9, 2025 |
| AgentDojo: LLM 에이전트의 프롬프트 인젝션 공격과 방어를 평가하는 동적 실험 플랫폼 |
|
0 | 234 | 10월 30, 2025 |
| GDPval: OpenAI가 공개한, 실무 중심의 AI 성능 평가를 위한 프레임워크 |
|
0 | 342 | 9월 28, 2025 |
| GPTEval3D: Text-to-3D 모델 평가 프레임워크 |
|
0 | 253 | 1월 15, 2024 |