leaderboard
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
FutureBench: AI 에이전트의 미래 예측 능력을 평가하기 위한 벤치마크 (feat. Hugging Face) |
![]() |
0 | 225 | 8월 3, 2025 |
Salesforce, CRM을 위한 LLM 벤치마크와 리더보드 공개 |
![]() |
0 | 384 | 6월 27, 2024 |
W&B, 한국어 LLM 리더보드 'Horangi(호랑이)' 공개 |
![]() |
0 | 1240 | 4월 2, 2024 |
벤치마크가 목표가 될 때: LLM 리더보드의 민감성에 대한 논문 |
![]() |
0 | 1084 | 3월 5, 2024 |