|
Agent Governance Toolkit: Microsoft가 공개한 AI 에이전트 거버넌스 도구
|
|
0
|
792
|
5월 28, 2026
|
|
Anthropic, 오픈소스 정렬 평가 도구 Petri를 Meridian Labs에 기증하며 Petri 3.0 공개
|
|
0
|
179
|
5월 9, 2026
|
|
Claude 사용자 100만 대화에 기반한 개인 조언 요청과 아첨형 응답 문제에 대한 연구 (feat. Anthropic)
|
|
0
|
241
|
5월 5, 2026
|
|
Alignment Whack-a-Mole: LLM 파인튜닝이 정렬을 우회하여 저작권 도서의 그대로 기억을 활성화하는 메커니즘에 대한 연구
|
|
0
|
138
|
5월 3, 2026
|
|
AI가 노동 시장에 미치는 영향: 새로운 측정 지표 '관측된 노출도'와 초기 증거 (feat. Anthropic)
|
|
0
|
330
|
3월 24, 2026
|
|
Anthropic, 지난 9월 Claude Code를 악용해 발생한 AI 기반 사이버 스파이 작전에 대한 조사 결과 공개 [PDF/영문/13p]
|
|
0
|
344
|
11월 17, 2025
|
|
OpenDataLoader PDF: AI를 위한 안전하고 고성능의 PDF 처리 도구
|
|
0
|
3123
|
9월 26, 2025
|
|
ArtPrompt: LLM에 대한 ASCII Art 기반의 공격 (ArtPrompt: ASCII Art-based Jailbreak Attacks against Aligned LLMs)
|
|
0
|
595
|
3월 10, 2024
|
|
TigerLab: LLM을 위한 오픈소스 도구모음 (총 4종: RAG, 파인튜닝 + 출시 예정 DA, Safety)
|
|
0
|
789
|
11월 5, 2023
|