- 이 글은 GPT 모델로 자동 요약한 설명으로, 잘못된 내용이 있을 수 있으니 원문을 참고해주세요!
- 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다!
[2023/07/31 ~ 08/06] 이번 주의 주요 ML 논문
top-ml-papers-of-the-week paper
이번 주에는 다양한 분야의 머신러닝 논문들이 발표되었습니다. 특히, 언어 모델과 관련된 논문들이 주를 이루었는데, 이는 최근 언어 모델의 발전과 그 활용 가능성이 높아지고 있음을 보여줍니다.
또한, 의료 분야나 로봇 제어 등 다양한 분야에서의 머신러닝 활용에 대한 논문들도 주목할 만 합니다.
주요 논문 목록
1. RLHF의 개방형 문제와 한계 (Open Problem and Limitation of RLHF) rlhf
- 이 논문은 RLHF의 개방형 문제와 한계에 대한 개요를 제공합니다.
더보기: https://twitter.com/arankomatsuzaki/status/1685813753063870465
2. Med-Flamingo med-flamingo
- 이 논문은 적은 수의 의료 시각 질문에 대한 답변을 가능하게 하는 새로운 다중 모달 모델을 제시합니다. 의사들에 의한 평가에서는 의사들의 평가에서 최대 20%의 향상을 보였습니다.
더보기: https://twitter.com/Michael_D_Moor/status/1685804620730540033
3. ToolLLM toolllm
- 이 논문은 LLMs가 실제 세계의 16000개 API와 상호작용할 수 있게 하는 프레임워크를 제시합니다. 이 프레임워크는 데이터 준비, 학습, 평가를 가능하게 합니다.
더보기: https://twitter.com/omarsar0/status/1687531613574348800
4. Skeleton-of-Thought skeleton-of-thought
- 이 논문은 먼저 답변의 뼈대를 생성하고, 각 뼈대 포인트의 내용을 생성하기 위해 병렬 API 호출을 수행하는 프롬프팅 전략을 제안합니다.
더보기: https://twitter.com/omarsar0/status/1685832487103008768
5. MetaGPT metagpt
- 이 논문은 LLM 기반의 다중 에이전트를 포함하는 프레임워크를 제시합니다. 이는 MetaGPT가 다양한 소프트웨어 개발, 코드 생성 작업, 심지어 AutoGPT와 LangChain과 같은 도구를 사용한 데이터 분석을 수행할 수 있게 합니다.
더보기: https://twitter.com/ai_database/status/1686949868298973184
6. OpenFlamingo openflamingo
- 이 논문은 3B에서 9B 파라미터에 이르는 자동 회귀 시각-언어 모델의 가계도를 소개합니다. 기술 보고서는 모델, 학습 데이터, 평가 스위트를 설명합니다.
더보기: https://twitter.com/anas_awadalla/status/1687295129005195264
7. The Hydra Effect hydrea-effect
- 이 논문은 언어 모델이 자체 수리 속성을 보여줍니다. 어텐션 헤드의 한 계층이 제거되면 다른 후속 계층이 그 기능을 대신 수행하게 됩니다.
더보기: https://twitter.com/_akhaliq/status/1686192437771788288
8. Self-Check selfcheck
- 이 논문은 LLMs가 비선형적 사고와 다단계 추론에 의존하는 복잡한 작업을 수행하기 위해 필요한 자체 검사 기능을 가지고 있는지를 탐구합니다.
더보기: https://twitter.com/_akhaliq/status/1686561569486827520
9. Agents Model the World with Language
- 이 논문은 미래의 텍스트와 이미지 표현을 예측하는 다중 모달 세계 모델을 학습하는 에이전트를 제시합니다.
더보기: https://twitter.com/johnjnay/status/1687277999517818880
10. AutoRobotics-Zero autorobotics-zero rt-2
- 이 논문은 갑작스러운 환경 변화에 필요한 적응적 행동을 가능하게 하는 제로샷 적응 정책을 발견합니다.
더보기: https://twitter.com/XingyouSong/status/1686190266578046976