llm-benchmark
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
대규모 언어 모델(LLM) 기반 합성 데이터(Synthetic Data)의 생성, 큐레이션 및 평가에 대한 종합적인 연구(Survey) | 0 | 1003 | 7월 5, 2024 | |
:hugs: Hugging Face의 OpenLLM 리더보드 개선: Open-LLM Leaderboard v2 | 0 | 810 | 7월 3, 2024 | |
Salesforce, CRM을 위한 LLM 벤치마크와 리더보드 공개 | 0 | 292 | 6월 27, 2024 | |
MMLU-Pro, LLM 성능 평가를 위한 벤치마크인 MMLU의 개선된 버전 | 0 | 1189 | 5월 21, 2024 |