sft-memorizes-rl-generalizes
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
SFT Memorizes, RL Generalizes: Foundation Model의 사후 학습 방법에 대한 비교 연구 |
![]() |
0 | 291 | 2월 4, 2025 |
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
SFT Memorizes, RL Generalizes: Foundation Model의 사후 학습 방법에 대한 비교 연구 |
![]() |
0 | 291 | 2월 4, 2025 |