[TLDR] 오늘의 AI 뉴스, 2023-11-22: 샘 알트먼이 OpenAI에 복귀 👋, 스테이블 비디오 📹, Go 언어로 랭체인 🦜

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :star_struck:
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:
TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

샘 알트먼, OpenAI의 CEO로 복귀 / Sam Altman to return as CEO of OpenAI (3 minute read)

이사회 쿠데타 이후 샘 알트먼과 그렉 브록먼 전 사장이 복귀했으며, 투자자들은 이를 회사의 사명을 위한 승리로 보고 있습니다. 이번 개편에는 OpenAI의 거버넌스를 재설정하기 위한 새로운 이사회와 최근의 혼란에 대한 계획된 조사가 포함됩니다. 마이크로소프트와 알트먼은 모두 확대된 이사회에서 자리를 차지하기를 원합니다.

OpenAI is welcoming Sam Altman and former President Greg Brockman back following the boardroom coup, a move seen by investors as a win for the firm's mission. This shake-up includes a new board aimed at resetting OpenAI's governance and a planned investigation into the recent turmoil. Both Microsoft and Altman wish to occupy seats in an expanded board.

Windows AI Studio: Windows에서 AI 모델을 더 쉽게 실행하는 방법 / Microsoft And Nvidia Are Making It Easier To Run AI Models On Windows (1 minute read)

Microsoft는 개발자가 AI 모델에 액세스하고 구성할 수 있는 허브인 Windows AI Studio를 발표했으며, Azure AI Studio 및 Hugging Face의 도구와 모델 구성 UI 및 성능 테스트 템플릿과 같은 기능을 제공합니다. 엔비디아는 대규모 언어 모델을 로컬에서 실행할 수 있고 개인 정보 보호 기능을 강화한 GeForce RTX 30 및 40 시리즈 GPU가 탑재된 PC용 TensorRT-LLM을 업데이트했습니다.

Microsoft has announced Windows AI Studio, a hub for developers to access and configure AI models, with tools from Azure AI Studio and Hugging Face and features like model configuration UI and performance testing templates. Nvidia updated its TensorRT-LLM for PCs with GeForce RTX 30 and 40 Series GPUs, enabling local running of large language models and enhancing privacy.

구글, 제미니(Gemini) 출시 연기 / Gemini Delays Launch Of Gemini (2 minute read)

구글은 대규모 언어 모델(LLM)과 GPT-4 경쟁 제품인 제미니의 출시를 2024년 1분기까지 연기했는데, 이는 이 제품이 OpenAI의 GPT-4와 비슷하거나 능가할 수 있을지에 대한 우려와 외부 개발자의 액세스를 허용하기 전에 소비자 제품을 강화하는 데 집중하기 위해서입니다.

Google has postponed the launch of its large language model (LLM) and GPT-4 competitor Gemini until Q1 of 2024 due to concerns about its ability to match or surpass OpenAI's GPT-4 and a focus on strengthening its consumer offerings before allowing external developer access.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

안정적인 비디오 / Stable Video (4 minute read)

14프레임의 동영상을 생성하도록 학습된 Stability AI의 Stable Video는 콘텐츠 제작의 미래를 엿볼 수 있습니다.

Trained to generate 14 frames of video, Stable Video from Stability AI is a glimpse into the future of content creation.

심층 분석: SDXL의 잠재 공간(latent space) 설명하기 / Deep Dive: Explaining SDXL Latent Space (22 minute read)

기존 안정적 확산 모델의 혁신 중 하나는 확산을 위해 더 작은 잠복 공간을 사용한다는 점입니다. 즉, 확산이 픽셀이 아니라 일부 압축된 이미지 표현에서 발생한다는 의미입니다. 이 게시물에서는 SDXL에서 이 공간을 해석하는 몇 가지 방법을 살펴봅니다.

One of the innovations of the original Stable Diffusion model was the use of a smaller latent space for diffusion. This means the diffusion doesn’t happen on pixels but on some compressed image representation. This post dives into some ways to interpret that space for SDXL.

정확한 룩헤드 디코딩으로 추론 지연 시간 2.3배 단축 / Exact Lookahead Decoding Reduces Inference Latency 2.3x (14 minute read)

자동 회귀 언어 모델 추론의 속도를 높이는 방법에는 여러 가지가 있습니다. 사람들이 선호하는 한 가지 방법은 초안 모델을 사용하는 것입니다. 이 방법에는 두 개의 모델이 필요하지만 속도가 느릴 수 있습니다. 하지만 동일한 모델에서 관련 엔그램을 생성하면 초안 모델의 필요성을 완화하고 생성 속도를 선형적으로 높일 수 있습니다.

There are many ways to speed up autoregressive language model inference. One way that people are excited about is using a draft model. This requires two models but it can be slower. However, by generating related ngrams from the same model, you can alleviate the need for a draft model and speed up generation linearly.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

Go 언어로 LangChain / LangChain in Go (GitHub Repo)

이제 LangChain을 사용하여 언어 모델을 Go 프로그램에 쉽게 통합할 수 있습니다. 여기에는 Ollama와 같은 프레임워크로 로컬 모델을 실행하는 것도 포함됩니다.

It’s now possible to easily integrate language models into your Go programs with LangChain. This includes running local models with frameworks like Ollama.

3분 안에 모든 GGUF 모델 배포 / Deploy any GGUF model in 3 minutes (3 minute read)

Llama.cpp와 GGUF 서버를 사용하여 HuggingFace 호스팅 모델을 제공하는 엔드포인트를 매우 빠르게 배포할 수 있습니다.

You can very quickly deploy an endpoint that serves HuggingFace-hosted models using llama.cpp and GGUF server.

프로덕션급 LLM 앱을 위한 개발자 가이드 / The Developer's Guide to Production-Grade LLM Apps (4 minute read)

LLM 애플리케이션을 개발하는 것과 프로덕션 환경에 성공적으로 배포하는 것은 별개의 문제입니다. 이 게시물에서는 개발 환경에서 엄격한 프로덕션 환경으로 LLM 애플리케이션을 전환할 때 정확도를 극대화하기 위한 개발자 가이드를 제공하여 복잡한 과정을 간소화합니다.

Developing LLM applications is one thing, deploying them successfully in production is another. This post cuts through the complexity, offering a developer's guide to maximizing accuracy as you transition your LLM applications from the dev environment to the rigors of production.

:gift: 그 외 소식 / Miscellaneous

OpenAI, 자체 CEO 드라마에 대한 농담이 담긴 ChatGPT 기능 출시 / OpenAI Releases A ChatGPT Feature With A Joke About Its Own CEO Drama (2 minute read)

이제 모든 무료 사용자가 음성 채팅 기능을 사용할 수 있습니다. OpenAI는 CEO 드라마에 대한 농담과 함께 출시했습니다.

ChatGPT with voice is now available for all free users. OpenAI released it with a joke about its CEO drama.

OpenAI 실패가 스타트업에 미치는 영향 / The implications of the OpenAI fiasco on startups (2 minute read)

개발자 생태계에서 OpenAI의 지배적인 위치가 갑자기 위험에 처하면서 소규모 회사가 새로운 공백을 메울 수 있는 기회가 생겼습니다. Microsoft가 AI의 승자가 될 가능성이 높지만, Anthropic과 같은 다른 모델 계층 회사들이 이 혼란을 기회로 삼을 수도 있습니다.

OpenAI’s dominant place in the developer ecosystem is suddenly at risk, presenting an opportunity for smaller companies to fill a new void. Microsoft will likely walk away as the AI winner, but perhaps other model-layer companies like Anthropic will take advantage of the disturbance.

처음으로 기존 일기 예보를 능가하는 AI / AI Outperforms Conventional Weather Forecasting For The First Time (4 minute read)

사이언스 저널에 발표된 한 연구에 따르면 구글 딥마인드의 AI 기상학 모델인 그래프캐스트는 기존의 일기 예보 방법보다 훨씬 뛰어난 성능을 발휘하여 최대 10일 전의 전 세계 기상 상태를 정확하게 예측하는 것으로 나타났습니다.

A study published in the journal Science revealed that Google DeepMind's AI meteorology model, GraphCast, significantly outperforms traditional weather forecasting methods, accurately predicting global weather conditions up to 10 days ahead.

(더 읽어보기 :point_right: [GN] GraphCast: DeepMind가 공개한 빠르고 정확한 글로벌 기상 예측 모델)

:zap: 더 읽어보기 / Quick Links

아마존, GPT-4보다 두 배 많은 매개 변수로 AI 학습 (1 분 읽기) / Amazon Reportedly Training AI With Twice As Many Parameters As GPT-4 (1 minute read)

아마존은 2조 개의 파라미터를 자랑하는 대규모 언어 모델인 올림푸스를 통해 AI 경쟁에 뛰어들 준비를 하고 있으며, OpenAI의 GPT-4와 구글의 바드를 능가하는 성능을 목표로 하고 있습니다.

Amazon is gearing up to enter the AI race with Olympus, a large language model boasting 2 trillion parameters, aiming to surpass OpenAI's GPT-4 and Google's Bard in capability.

에멧 시어, 이사회가 샘 알트먼의 잘못을 증명하지 못하면 OpenAI를 떠나겠다고 협박하다 / Emmett Shear Threatening To Leave OpenAI If Board Can’t Prove Sam Altman’s Wrongdoing (1 minute read)

에멧 시어(Emmett Shear) OpenAI 임시 CEO는 이사회가 샘 알트먼의 잘못에 대한 증거를 제시하지 못하면 OpenAI에서 물러나겠다고 위협한 것으로 알려졌습니다.

Interim OpenAI CEO Emmett Shear is reportedly threatening to leave his position at OpenAI if the board can't show evidence of Sam Altman’s wrongdoing.

리버브 / Reverb (Product)

Reverb는 과거에 작성된 양식의 학습을 통해 RFP나 설문지와 같은 온라인 양식에 AI 기반이지만 오류가 없는 답변을 제공합니다.

Reverb delivers AI-powered but hallucination-free answers to online forms like RFPs and questionnaires with training from past completed forms.