|
OAT 🌾: 대규모 언어 모델(LLM)의 온라인 정렬을 위한 연구 친화적 프레임워크 (Online Alignment Toolkit for LLMs)
|
|
0
|
169
|
10월 9, 2025
|
|
GLM-4.1V-Thinking: 강화학습 기반의 범용 멀티모달 추론 모델 (feat. Zhipu AI)
|
|
0
|
400
|
7월 7, 2025
|
|
[2024/12/09 ~ 12/15] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
493
|
12월 16, 2024
|
|
[GN] "RLHF는 RL의 작은 부분일 뿐입니다." - Andrej Karpathy
|
|
0
|
262
|
8월 9, 2024
|
|
[2024/02/19 ~ 02/25] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
741
|
2월 26, 2024
|
|
[2023/09/25 ~ 10/01] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
1044
|
10월 2, 2023
|
|
[TLDR] 오늘의 AI 뉴스, 2023-09-04: 컨텍스츄얼, 2,000만 달러 펀딩 💰, ChatGPT 사용자 세션 분석 🤖, RLHF 대 RLAIF 👊
|
|
1
|
312
|
12월 31, 2023
|
|
[GN] pykoi - LLM을 위한 데이터 & 피드백 수집용 UI 라이브러리
|
|
0
|
294
|
8월 22, 2023
|
|
[2023/07/31 ~ 08/06] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
394
|
8월 8, 2023
|
|
[TLDR] 오늘의 AI 뉴스, 2023-07-20: Apple-GPT 🍎, Keras Core 출시 🤖, GPT-4의 흔들리는 마음 🧠
|
|
1
|
565
|
12월 31, 2023
|
|
[TLDR] 오늘의 AI 뉴스, 2023-05-23: OpenAI의 초지능 거버넌스🏛️, Apple - ChatGPT 사용 제한🍎, 강화 학습으로 디퓨전 모델 학습🦾
|
|
1
|
362
|
12월 31, 2023
|
|
Stability AI, 세계 최초의 오픈 소스 RLHF LLM 챗봇인 StableVicuna 출시
|
|
1
|
1707
|
4월 29, 2023
|