[TLDR] 오늘의 AI 뉴스, 2023-11-16: Microsoft 맞춤형 AI 칩 💾, Google의 생성형 검색 🔍, 스마트 안경에서의 물체 감지 👓

:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

자체 AI 칩을 만드는 Microsoft / Microsoft Is Making Custom AI Chips (3 minute read)

Microsoft는 Nvidia에 대한 의존도를 낮추고 AI 기반 미래를 준비하기 위해 자체 맞춤형 AI 칩인 Azure 마이아 AI와 Azure 데이터 센터용 ARM 기반 CPU인 Azure 코발트를 개발했습니다. 이 칩은 2024년에 출시될 예정입니다. microsoft ai-chip

Microsoft has developed its own custom AI chip, Azure Maia AI, and an Arm-based CPU for Azure data centers, Azure Cobalt, aiming to reduce reliance on Nvidia and prepare for an AI-driven future. The chips are set to launch in 2024.

Google의 생성형 검색이 120개 국가에 추가 출시되었습니다 / Google’s generative search rolled out to 120 more countries (3 minute read)

Google의 검색 생성 경험(SGE)은 올해 초 첫 선을 보인 후 여러 언어로 더 많은 국가에 서서히 제공되고 있습니다. Google은 주요 검색 시스템에 많은 영향을 미치기 때문에 이번 출시에 신중하고 느린 속도를 취하고 있습니다. search-generative-experience

Google’s Search Generative Experience (SGE) is slowly being made available to more countries in many languages after debuting earlier this year. The company is taking a slow and measured pace to this release as it touches many of its key search systems.

GitHub, Copilot으로 AI 기반 개발자 플랫폼으로 전환 선언 / Copilot transforms GitHub into the AI-powered developer platform (10 minute read)

GitHub의 Copilot X는 모든 단계에 AI를 내장하여 소프트웨어 개발을 혁신합니다. GPT-4로 구동되는 새로운 Copilot Chat은 자연어 코딩을 가능하게 합니다. 2023년 12월에 출시됩니다. 조직 코드베이스에 맞게 조정된 Copilot Enterprise는 2024년 2월에 출시됩니다. 강화된 AI 보안 기능과 확장된 Copilot 파트너 프로그램은 GitHub의 서비스를 더욱 풍성하게 합니다.

GitHub's Copilot X revolutionizes software development by embedding AI in every stage. The new Copilot Chat, powered by GPT-4, enables natural language coding. It arrives in December 2023. Copilot Enterprise, tailored for organizational codebases, will launch in February 2024. Enhanced AI security features and the expanding Copilot Partner Program further enrich GitHub's offerings.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

스마트 안경에서의 물체 감지 / Object Detection on Smart Glasses (18 minute read)

이 팀은 비전용으로 설계된 새로운 RISC-V 하드웨어를 개발하여 저전력 및 초저지연으로 실시간 물체 감지를 가능하게 하는 초소형 YOLO 컴퓨터 비전 모델을 학습시켰습니다.

This team created a new RISC-V hardware designed for vision and trained an ultra-small YOLO computer vision model which enables real-time object detection at low power and extremely low latency.

직접 선호도 최적화로 모델 사실성 향상 / Direct Preference Optimization Improves Model Factuality (22 minute read)

선호도에 따라 모델을 최적화하는 것은 ChatGPT의 광범위한 채택을 가능하게 한 획기적인 기술 중 하나였습니다. 유사한 기술을 사용하여 모델의 정확성과 사실성을 개선하여 의료 리콜 오류를 50% 이상 줄일 수 있습니다.

Optimizing models according to preferences was one of the breakthroughs that enabled the widespread adoption of ChatGPT. Similar technologies can also be used to improve the correctness and factuality of models, reducing errors in medical recall by over 50%.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

알리바바의 Qwen Audio 모델 (GitHub Repo)

Qwen은 알리바바 클라우드의 일련의 모델입니다. 이 제품은 범용 오디오-언어 변환 모델입니다. 음악, 음성 등 다양한 작업을 수행할 수 있습니다. multimodal

Qwen is a series of models from Alibaba Cloud. This installment is a general-purpose audio-to-language model. It can perform a number of tasks for music, speech, and more.

GraphCast: 딥마인드가 공개한 일기 예보 모델 / DeepMind Weather Forecasting Model with Weights (GitHub Repo)

딥마인드는 몇 년 전부터 일기 예보를 연구해 왔습니다. 그래프 신경망을 기반으로 구축된 가장 최근 모델은 10일 예보에 매우 정확합니다. 딥마인드는 코드와 가중치를 공개하여, 위성 데이터가 있는 경우 로컬에서 실행할 수 있도록 했습니다.

DeepMind has been working on weather forecasting for a few years now. Its most recent model, built on graph neural networks, is extremely accurate for 10-day forecasts. DeepMind released code and weights so you can run it locally (if you have satellite data).

InterpAny-Clearer: 거리 인덱싱을 사용한 비디오 프레임 보간 / Video Frame Interpolation with Distance Indexing (4 minute read)

이 프로젝트에서는 '거리 인덱싱'이라는 새로운 방법을 도입하여 기존에는 물체의 움직임을 정확하게 예측하는 데 어려움을 겪었던 비디오 프레임 보간(VFI)을 개선합니다. 이 접근 방식은 프레임 간에 물체가 이동하는 거리에 대한 명시적인 정보를 모델에 제공함으로써 학습 목표를 명확히 하고 흐릿함을 줄입니다.

This project introduces a new method called "distance indexing" to improve video frame interpolation (VFI), which traditionally struggles with predicting precise object movements. This approach clarifies learning objectives and reduces blurriness by giving models explicit information about the distance an object travels between frames.

:gift: 그 외 소식 / Miscellaneous

라즈베리 파이에서 LLM 실행하기 / Running LLMs on a Raspberry PI (5 minute read)

최근 누군가가 미스트랄의 7B 모델을 박제 앵무새에 넣어 온라인에서 화제가 되었습니다. 이 게시물에서는 이 앵무새가 작동하는 데 사용한 기본 아이디어를 자세히 살펴봅니다.

Someone recently put Mistral’s 7B model into a stuffed parrot and it made the rounds online. This post dives into the basic ideas they used to get it working.

음악의 미래: 생성형 AI가 음악 산업을 변화시키는 방법 / The Future of Music: How Generative AI Is Transforming the Music Industry (6 minute read)

인공지능이 생성한 음악은 우리가 소비하는 음악의 미래가 될 수도 있고, 우리의 청취 습관을 형성하는 데 도움이 될 수도 있으며, 이는 잠재적으로 음악의 '중간 여정의 순간'이 될 수 있습니다.

AI-generated music could be the future of what we consume or what helps us shape our listening habits - this could potentially be music’s “Midjourney moment”.

AI 파멸론자들이 마침내 오랫동안 미뤄왔던 역풍을 맞고 있습니다 / AI Doomers Are Finally Getting Some Long Overdue Blowback (4 minute read)

AI가 우리 모두를 파멸시킬 것이라고 말했던 사람들은 이제 그들의 입장을 다시 검토해야 합니다. 'AI의 파멸'은 실제로는 대기업에게만 도움이 되었으며, AI 분야에서 일어나고 있는 오픈 소스 운동에는 기회가 많습니다.

Those who said AI would doom us all are now having to revisit their positions. “AI doom” really only helped the big guys, and opportunities abound for the open source movements happening in AI.

:zap: 더 읽어보기 / Quick Links

VocAI Chatbot (Product)

코드 없이 고객 지원 문의의 80%를 해결하세요.

Resolve 80% of your customer support questions with no code.

LLM Sherpa (GitHub Repo)

LLM Sherpa는 대규모 언어 모델 사용 사례를 가속화하기 위한 전략적 API를 제공합니다.

LLM Sherpa provides strategic APIs to accelerate large language model use cases.

딥마인드 애니메이션 갤러리 / Deepmind’s animation gallery (2 minute read)

Google의 딥마인드 연구 그룹은 다양한 AI 시스템에 대한 이해를 돕기 위해 여러 애니메이션과 아트를 공개했습니다. 애니메이션은 다소 이상하지만 미학적으로 아름답습니다.

Google’s deepmind research group has released a number of animations and art to build an understanding of different AI systems. The animations are somewhat odd but aesthetically beautiful.