reinforcement-learning
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
AlphaChip: 강화학습(RL) 기반의 칩 배치 생성 방법에 대한 연구 (feat. Google) | 0 | 159 | 10월 4, 2024 | |
LeanRL, PyTorch 기반의 강화학습(RL)을 위한 경량 라이브러리 (feat. CleanRL) | 0 | 157 | 9월 20, 2024 | |
LeRobot: Hugging Face가 제공하는 로봇 학습 모델 / 데이터셋 / 튜토리얼 | 0 | 313 | 9월 3, 2024 | |
[GN] "RLHF는 RL의 작은 부분일 뿐입니다." - Andrej Karpathy | 0 | 196 | 8월 9, 2024 | |
LlamaGym: OpenAI Gym 기반의 LLM 에이전트 파인튜닝 | 0 | 307 | 3월 23, 2024 |