[TLDR] 오늘의 AI 뉴스, 2023-05-29: AI에 대한 샘 알트먼의 낙관적 견해🪟, AI - 새로운 항생제 발견💉, 하이브리드 트랜스포머와 RNN 모델🔀

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :star_struck:

더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으시면 파이토치 한국 사용자 모임에 방문해주세요! :robot:

TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

TinyCorp, AMD용 딥 러닝 소프트웨어 개발을 위해 5백만 달러 모금 / TinyCorp raises $5m to build deep learning software for AMDs (4 minute read)

엔비디아는 GPU 시장에서 강력한 우위를 점하고 있습니다. 그 이유 중 상당 부분은 학습 및 추론 워크로드를 지원하는 커널과 소프트웨어에 기인합니다. AMD 칩은 매우 빠르지만 코드를 작성하는 것은 엄청나게 고통스럽습니다. 조지 홀츠와 개발진은 추론을 위해 처음부터 드라이버를 작성하고 추후에 트레이닝을 할 수 있도록 노력하고 있습니다. 컴퓨팅 제약이 있는 조직이 더 저렴한 AMD GPU를 사용할 수 있다면 큰 도움이 될 것입니다.

Nvidia has a strong advantage in the GPU market. Much of that can be attributed to their kernels and software supporting training and inference workloads. AMD chips are super fast, but writing code for them is impossibly painful. George Holtz and crew are now working to write drivers from the ground up first for inference then maybe training later. It would be a boon on compute constrained organizations if they could use the cheaper AMD GPUs.

샘 알트먼, AI에 대한 낙관적인 견해 공유 / Sam Altman Shares His Optimistic View Of AI (4 minute read)

OpenAI의 CEO인 샘 알트먼은 유럽 투어에서 AI의 미래에 대해 낙관적인 견해를 밝히며 교육 분야에서의 잠재적 활용을 강조하고 보호와 혁신의 균형을 맞추는 글로벌 규제 프레임워크의 필요성을 역설했습니다.

OpenAI's CEO, Sam Altman, expressed optimism about AI's future during his European tour, emphasizing its potential uses such as in education and stressing the need for a global regulatory framework that balances protection and innovation.

AI로 발견한 새로운 슈퍼버그 죽이는 항생제 / New superbug-killing antibiotic discovered using AI (5 minute read)

AI는 슈퍼버그인 아시네토박터 바우마니균(Acinetobacter baumannii)에 효과적인 새로운 항생제인 '아바우신(Abaucin)'을 발견하는 데 사용되었습니다. 수천 개의 알려진 약물로 학습된 AI는 90분 만에 6,000개 이상의 테스트되지 않은 화합물에서 잠재적인 항생제 후보를 추려냈습니다. 아바우신은 유망하지만 추가 테스트와 임상 시험이 필요합니다. 아바우신은 2030년경에 출시될 것으로 예상됩니다.

AI was used to discover "abaucin," a new antibiotic effective against the superbug Acinetobacter baumannii. The AI, trained with thousands of known drugs, shortlisted potential antibiotics from over 6,000 untested compounds in 90 minutes. Although promising, abaucin requires further tests and clinical trials. It is expected to be available around 2030.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

대규모 언어 모델 테스트를 위한 정리 기반 질의-응답(QA) 데이터셋 / A Theorem-Based Question-Answering Dataset for Testing Large Language Models (GitHub Repo)

연구원들은 350개 이상의 STEM(과학, 기술, 공학, 수학) 정리에 기반한 800개의 질문-답변 쌍을 사용하여 AI 언어 모델을 테스트하기 위한 최초의 데이터셋을 개발했습니다. 이 데이터 세트는 이러한 정리를 사용하여 복잡한 대학 수준의 문제를 해결하는 AI의 능력을 측정할 수 있는 새로운 벤치마크를 제공합니다.

Researchers have developed the first dataset for testing AI language models using 800 question-answer pairs based on over 350 STEM (Science, Technology, Engineering, and Mathematics) theorems. This dataset offers a new benchmark to measure an AI's ability to solve complex, university-level problems using these theorems.

학습없이 GPT4로 마인크래프트 학습하기 / Learning minecraft with GPT4 without training (10 minute read)

GPT-4는 현재까지 가장 강력한 언어 모델로 널리 알려져 있습니다. 하지만 API로 폐쇄되어 있기 때문에 새로운 작업을 위해 학습할 수 없습니다. Voyager는 코드를 "정책 표현"으로 사용하고 환경 오류와 성능을 자연어 피드백으로 사용합니다. 그런 다음 코드 함수 집합을 통해 GPT4는 다이아몬드 채굴 및 기타 작업에서 반복적으로 개선할 수 있습니다.

GPT-4 is widely regarded as the most powerful language model to date. However, because it is closed behind an API, we can’t train it for novel tasks. Voyager uses code as the “policy representation” and uses the environment errors and performance as natural language feedback. The set of code functions then allows GPT4 to iteratively improve at mining diamond and other tasks.

Anse (GitHub Repo)

Anse는 AI 채팅에 완전히 최적화된 UI입니다.

Anse is a fully optimized UI for AI chats.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

텍스트를 SQL로 변환할 때 발생하는 오류를 수정하는 새로운 방법 / A New Method for Correcting Errors in Converting Text to SQL (14 minute read)

이 논문은 컴퓨터가 일상 언어를 이해하고 데이터베이스 관리 및 조작에 사용되는 언어인 SQL로 변환하는 방법을 개선하는데 중점을 둡니다. 개별 단어 대신 코드의 전체 섹션을 살펴봄으로써 오류를 수정하는 새로운 방법을 소개하고, 기존 코드 언어 모델의 작동 방식에 더 가까운 SQL 쿼리에 대한 새로운 표현을 사용하여 정확도를 크게 향상시킵니다.

This paper focuses on improving how computers understand and convert everyday language into SQL, a language used for managing and manipulating databases. It introduces a new method that corrects errors by looking at whole sections of code instead of individual words, and uses a new representation for SQL queries that's closer to how pre-existing code language models work, leading to a significant improvement in accuracy.

트랜스포머와 RNN의 강점을 결합한 하이브리드 모델 / A Hybrid Model Combining the Strengths of Transformers and RNNs (24 minute read)

이 연구에서는 트랜스포머의 효율적인 병렬 학습과 순환신경망(RNN)의 효율적인 작동을 결합한 수신 가중치 키 값(RWKV)이라는 새로운 모델을 소개합니다. 선형 주의 메커니즘을 활용하는 고유한 접근 방식을 사용하는 RWKV는 여러 단계에 걸쳐 트랜스포머 또는 RNN처럼 사용할 수 있으며, 트랜스포머와 동등한 효과를 발휘하면서도 컴퓨팅 리소스를 더 효율적으로 사용할 수 있는 것으로 입증되었습니다.

This research introduces a new model called Receptance Weighted Key Value (RWKV), which brings together the efficient parallelized training of Transformers and the efficient operation of Recurrent Neural Networks (RNNs). With its unique approach of utilizing a linear attention mechanism, RWKV can be used like a Transformer or an RNN during different stages, proving equally effective as Transformers, but with more efficient use of computing resources.

사용자 피드백을 통한 질문 답변 시스템 개선 / Improving Question Answering System Through User Feedback (26 minute read)

연구자들은 질문에 대한 답변을 추출하는 시스템이 사용자의 피드백을 통해 지속적으로 개선될 수 있는 방법을 탐구합니다. 수천 건의 사용자 상호작용을 포함한 실험을 통해 사용자 피드백이 새로운 주제나 지식 영역에 적응하는 능력을 포함하여 시간이 지남에 따라 시스템의 성능을 크게 향상시키는 것을 발견했습니다.

Researchers explore how a system that extracts answers to questions can be constantly improved by feedback from human users. Through experiments involving thousands of user interactions, we found that user feedback significantly improved the system's performance over time, including its ability to adapt to new topics or areas of knowledge.

:gift: 그 외 소식 / Miscellaneous

아무도 말하지 않는 LLM 기반 개발의 어려운 점 / The hard stuff no one talks about building on LLMs (12 minute read)

언어 모델은 높은 잠재력을 가진 환상적인 새 도구입니다. 하지만 프로덕션 환경에 배포하기 어렵게 만드는 여러 가지 까다로운 문제가 있습니다. 이 게시물에서는 신속한 안정성, 모니터링 등에 대해 설명합니다. 애플리케이션에 언어 모델을 배포하기 위해 구축해야 하는 시스템을 간략하게 살펴봅니다.

Language models are fantastic new tools with high potential. However, they suffer from a set of challenging issues that makes them hard to deploy in production. This post discusses prompt reliability, monitoring, and more. It gives a glimpse into systems you’d need to build to deploy language models in your applications.

변호사, ChatGPT가 발명한 가짜 사례 인용 / Lawyer Cites Fake Case Invented By ChatGPT (5 minute read)

한 변호사가 ChatGPT를 사용하여 서면을 작성했는데, 가짜 판례가 등장하여 큰 곤경에 처하게 되었습니다.

A lawyer wrote his brief using ChatGPT, which hallucinated fake cases, landing him in deep trouble.

OpenAI는 유럽을 떠날 계획이 없다 / OpenAI Has No Plans To Leave Europe (2 minute read)

OpenAI는 유럽을 떠날 계획이 없다고 CEO 샘 알트먼(Sam Altman)이 금요일에 밝히며, 이번 주 초에 예정된 인공 지능 관련 법률을 준수하기 어려워지면 유럽을 떠나겠다고 위협한 것을 번복했습니다.

OpenAI has no plans to leave Europe, CEO Sam Altman said on Friday, reversing a threat made earlier this week to leave the region if it becomes too hard to comply with upcoming laws on artificial intelligence.

:zap: 더 읽어보기 / Quick Links

벤 괴르첼과의 인터뷰 / Interview With Ben Goertzel (6 minute read)

저명한 인공지능 연구자인 벤 괴르첼이 미래 인공지능의 발전과 사회적 영향에 대한 자신의 견해를 공유합니다. 그는 의식 있는 인공지능의 가능성에 대해 이야기하며 인공지능의 권리를 보류하는 것은 비윤리적일 수 있다고 제안합니다. 그러나 그는 초지능 AI의 잠재적 위험에 대해서도 강조합니다.

Ben Goertzel, renowned AI researcher, shares his views on future AI developments and their societal implications. He talks about the possibility of conscious AIs, suggesting it may be unethical to withhold rights from them. However, he also highlights potential risks of superintelligent AIs.

LangChain으로 구글 드라이브의 데이터에 접근하는 GPT / GPT your GDrive with LangChain (2 minute read)

개인 정보에 액세스하면 다양한 작업에 대한 환각을 크게 줄일 수 있습니다. 이 통합을 통해 Google 드라이브에 연결하여 언어 모델에 제공할 데이터를 수집할 수 있습니다.

Accessing personal information dramatically reduces hallucinations for various tasks. This integration lets you connect to your Google Drive and ingest data to give to language models.

Arc’s HireAI (Product)

HireAI는 원격 개발자를 고용하는 더 스마트한 방법입니다.

HireAI is the smarter way to hire remote developers.

ClipnoteAI (Product)

Clipnote는 AI YouTube 동영상 요약기입니다.

Clipnote is an AI YouTube video summarizer.