|
The LLM Evaluation Guidebook: Hugging Face가 공개한 LLM 평가를 위한 종합적이고 실질적인 안내서
|
|
0
|
510
|
12월 9, 2025
|
|
LLM Optimizer: 다양한 LLM의 추론 성능을 벤치마킹하고 최적화하는 도구 (feat. BentoML)
|
|
0
|
302
|
9월 12, 2025
|
|
[2025/08/25 ~ 31] 이번 주에 살펴볼 만한 AI/ML 논문 모음
|
|
0
|
4482
|
8월 31, 2025
|
|
[2025/07/07 ~ 13] 이번 주에 살펴볼 만한 AI/ML 논문 모음
|
|
1
|
829
|
7월 16, 2025
|
|
대규모 언어 모델(LLM) 기반 합성 데이터(Synthetic Data)의 생성, 큐레이션 및 평가에 대한 종합적인 연구(Survey)
|
|
0
|
2650
|
7월 5, 2024
|
|
:hugs: Hugging Face의 OpenLLM 리더보드 개선: Open-LLM Leaderboard v2
|
|
0
|
1774
|
7월 3, 2024
|
|
Salesforce, CRM을 위한 LLM 벤치마크와 리더보드 공개
|
|
0
|
407
|
6월 27, 2024
|
|
MMLU-Pro, LLM 성능 평가를 위한 벤치마크인 MMLU의 개선된 버전
|
|
0
|
2962
|
5월 21, 2024
|