파이토치 한국 사용자 모임
best-of-n
글
댓글
조회수
활동
TTT-Discover, 추론(Test-time) 중 모델을 실시간으로 학습시켜 과학 문제 해결 성능을 개선하는 방식에 대한 연구 (feat. Google DeepMind, NVIDIA, Stanford)
읽을거리&정보공유
nvidia
,
stanford
,
paper
,
deepmind
,
reinforcement-learning
,
test-time-compute
,
alphaevolve
,
ttt-discover
,
learning-to-discover-at-test-time
,
test-time-training
,
scientific-discovery
,
ai4science
,
best-of-n
,
predictor-upper-confidence-bound-applied-to-trees
,
state-reuse
,
entropic-objective
,
adaptive-beta-scheduling
,
the-bitter-lesson
1
311
1월 28, 2026