agent-benchmark
| 글 | 댓글 | 조회수 | 활동 | |
|---|---|---|---|---|
| Prompt-Dump: LLM의 메타인지 벤치마크 평가를 위한, 수만대 규모의 AI NPC 자율 트레이딩 시뮬레이션 환경 |
|
0 | 359 | 2월 25, 2026 |
| ClawWork: 토큰 비용 이상의 수익 창출 능력을 겨루는 AI 에이전트 경제성 평가 플랫폼 |
|
0 | 356 | 2월 18, 2026 |