[2023/07/24 ~ 07/30] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)

9bow · 7월 31, 2023, 10:57오전

이 글은 GPT 모델로 자동 요약한 설명으로, 잘못된 내용이 있을 수 있으니 원문을 참고해주세요!
읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다!

소개

이 글은 2023년 7월 24일부터 7월 30일까지 주간 ML 논문 톱10을 소개합니다. 이 논문들은 다양한 분야에서의 최신 연구를 반영하고 있습니다.

요약

Universal Adversarial LLM Attacks

ChatGPT와 Bard와 같은 정렬된 모델이 이례적인 행동을 생성하도록 하는 보편적이고 전이 가능한 적대적 공격을 찾습니다. 이 방법은 탐욕스럽고 그래디언트 검색을 사용하여 자동으로 적대적인 접미사를 생성합니다.

https://twitter.com/andyzou_jiaming/status/1684766170766004224?s=20

RT-2

웹과 로보틱스 데이터 모두에서 학습하는 새로운 엔드-투-엔드 비전-언어-액션 모델을 소개합니다. 이 모델은 학습된 지식을 일반화된 지시사항으로 로봇 제어에 번역할 수 있게 합니다.

https://twitter.com/GoogleDeepMind/status/1684903412834447360?s=20

Med-PaLM Multimodal

14개의 다른 작업을 포함하는 새로운 다중 모달 생물의료 벤치마크를 소개합니다. 이는 Med-PaLM Multimodal이라는 일반적인 생물의료 AI 시스템에 대한 개념 증명을 제시하며, 임상 텍스트, 이미징, 그리고 유전체학과 같은 다양한 유형의 생물의료 데이터를 지원합니다.

https://twitter.com/vivnat/status/1684404882844024832?s=20

Tracking Anything in High Quality

비디오에서 높은 품질로 어떤 것이든 추적하는 프레임워크를 제안합니다. 이는 비디오 다중 객체 세분화와 사전 훈련된 마스크 정제 모델로 구성되어 추적 결과를 정제하는 데 사용됩니다. 이 모델은 VOTS2023 챌린지에서 2위를 차지했습니다.

https://twitter.com/arankomatsuzaki/status/1684380610901467136?s=20

Foundation Models in Vision

컴퓨터 비전에서의 기반 모델에 대한 연구 방향과 열린 도전 과제를 논의하는 조사와 전망을 제시합니다.

https://twitter.com/KhanSalmanH/status/1684496991215316992

L-Eval

법률, 금융, 학교 강의, 긴 대화, 소설, 회의 등을 포함하는 411개의 긴 문서와 2K 쿼리-응답 쌍을 포함하는 긴 컨텍스트 언어 모델에 대한 표준화된 평가를 제공합니다.

https://twitter.com/WenxiangJiao/status/1682208555762610176?s=20

LoraHub

동적 LoRA 구성을 통해 효율적인 크로스-태스크 일반화를 가능하게 하는 LoraHub를 소개합니다. 이는 LoRA 모듈의 조합을 가능하게 하며, 사람의 전문 지식이나 추가적인 매개변수/기울기 없이 피추 시나리오에서 컨텍스트 학습의 성능을 모방합니다.

https://twitter.com/_akhaliq/status/1684030297661403136

Survey of Aligned LLMs

데이터 수집, 훈련 방법론, 모델 평가 등을 포함한 정렬 접근법에 대한 포괄적인 개요를 제시합니다.

https://twitter.com/omarsar0/status/1684960627423420419

WavJourney

LLM을 활용하여 다양한 오디오 모델을 연결하고, 매력적인 스토리텔링을 위한 오디오 콘텐츠를 구성합니다. 이는 설명 가능하고 상호 작용적인 디자인을 포함하며, 오디오 제작에서 창의적인 제어를 강화합니다.

https://twitter.com/LiuXub/status/1684338437934002176?s=20

FacTool

LLM에 의해 생성된 텍스트의 사실성 감지를 위한 작업과 도메인에 구애받지 않는 프레임워크를 제안합니다. 이 방법의 효과는 코드 생성과 수학적 추론과 같은 작업에서 테스트되며, 벤치마크 데이터셋이 출시되었고, ChatGPT 플러그인이 포함되어 있습니다.

https://twitter.com/gneubig/status/1684658613921669120

소개

요약