주제에 leaderboard 태그가 달렸습니다

글	조회수	활동
Prompt-Dump: LLM의 메타인지 벤치마크 평가를 위한, 수만대 규모의 AI NPC 자율 트레이딩 시뮬레이션 환경 읽을거리&정보공유 benchmark , leaderboard , ai-for-trading , agent-benchmark , prompt-dump , metacognitive-dataset , final-bench , trading-simulation-environment , pumpdump	465	2월 25, 2026
ClawWork: 토큰 비용 이상의 수익 창출 능력을 겨루는 AI 에이전트 경제성 평가 플랫폼 읽을거리&정보공유 leaderboard , gdpval , hkuds , nanobot , openclaw , clawwork , agent-benchmark	414	2월 18, 2026
FutureBench: AI 에이전트의 미래 예측 능력을 평가하기 위한 벤치마크 (feat. Hugging Face) 읽을거리&정보공유 huggingface , agentbench , benchmark , leaderboard , smolagents	307	8월 3, 2025
Salesforce, CRM을 위한 LLM 벤치마크와 리더보드 공개 읽을거리&정보공유 salesforce , leaderboard , llm-benchmark , llm-for-crm , llm-for-business , llm-leaderboard	448	6월 27, 2024
W&B, 한국어 LLM 리더보드 'Horangi(호랑이)' 공개 읽을거리&정보공유 wandb , korean-llm , leaderboard , korean-llm-leaderboard , horangi , llm-kr-eval , mt-bench	1333	4월 2, 2024
벤치마크가 목표가 될 때: LLM 리더보드의 민감성에 대한 논문 읽을거리&정보공유 llm , paper , llm-evaluation , benchmark , leaderboard	1154	3월 5, 2024

Prompt-Dump: LLM의 메타인지 벤치마크 평가를 위한, 수만대 규모의 AI NPC 자율 트레이딩 시뮬레이션 환경

benchmark , leaderboard , ai-for-trading , agent-benchmark , prompt-dump , metacognitive-dataset , final-bench , trading-simulation-environment , pumpdump