agent-benchmark

글		댓글	조회수	활동
Prompt-Dump: LLM의 메타인지 벤치마크 평가를 위한, 수만대 규모의 AI NPC 자율 트레이딩 시뮬레이션 환경 읽을거리&정보공유 benchmark , leaderboard , ai-for-trading , agent-benchmark , prompt-dump , metacognitive-dataset , final-bench , trading-simulation-environment , pumpdump		0	438	2월 25, 2026
ClawWork: 토큰 비용 이상의 수익 창출 능력을 겨루는 AI 에이전트 경제성 평가 플랫폼 읽을거리&정보공유 leaderboard , gdpval , hkuds , nanobot , openclaw , clawwork , agent-benchmark		0	400	2월 18, 2026