[TLDR] 오늘의 AI 뉴스, 2023-10-09: Microsoft AI 칩 💾, AI 기반 저널리즘 📓, 음악 생성 스트리밍 🎵

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터 의 승인을 받아 AI 소식을 DeepL로 번역 하여 전합니다. :star_struck:
더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으신가요? 지금 파이토치 한국어 커뮤니티에 방문해주세요! :robot:
TLDR-AI 뉴스 레터 썸네일


:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

OpenAI, 자체 AI 칩 개발 고려 중 / OpenAI Said To Be Considering Developing Its Own AI Chips (1 minute read)

OpenAI는 GPU 공급 부족으로 인해 자체 AI 칩 개발을 고려하고 있습니다.

OpenAI is considering creating its own AI chips due to the increasing shortage in GPU supply.

(더 읽어보기 :point_right: [GN] OpenAI, 자체 AI 칩 개발 고려 중)

BBC는 OpenAI 데이터 스크래핑을 차단하고 있지만 AI 기반 저널리즘에는 개방적입니다 / The BBC is blocking OpenAI data scraping but is open to AI-powered journalism (3 minute read)

BBC는 투명성과 공익성을 강조하며 저널리즘에서 제너레이티브 AI를 사용하기 위한 원칙을 세우고 있습니다. 이 방송사는 AI의 잠재력을 탐색하는 동안 저작권이 있는 콘텐츠를 보호하기 위해 OpenAI 웹 크롤러를 차단했습니다. openai ai-copyright

The BBC is setting principles for using generative AI in journalism, emphasizing transparency and public interest. While it is exploring AI's potential, the broadcaster has blocked OpenAI web crawlers to safeguard copyrighted content.

마이크로소프트, 11월에 첫 AI 칩 출시 예정 / Microsoft May Debut It’s First AI Chip In November (1 minute read)

Microsoft는 다가오는 이그나이트 2023 컨퍼런스에서 자체 AI 칩을 공개하여 회사의 AI 발전을 중단 없이 유지하고 독점 AI 칩을 사용하는 Amazon 및 Google과 같은 경쟁사와 수익성 있는 경쟁을 할 수 있는 입지를 확보할 수 있을 것입니다. microsoft ai-chip

Microsoft may unveil its own AI chip at the upcoming Ignite 2023 conference, ensuring the company's AI advancements remain uninterrupted and potentially positioning it to compete profitably with peers like Amazon and Google, who also use proprietary AI chips.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

MusicGen 스트리밍 / MusicGen streaming (5 minute read)

스트리밍 음악 생성은 일반적으로 모든 음악이 완료될 때까지 기다려야 합니다. 하지만 이는 실시간 또는 장시간 생성 애플리케이션이 어려움을 겪는다는 것을 의미합니다. 이 코드를 사용하면 이제 음악이 도착하는 즉시 스트리밍할 수 있습니다.

Streaming music generation usually has to wait for all the music to be completed. However, this means real time or long generation applications struggle. With this code, you can now stream the chunks of music as they arrive.

LLM 미세 조정의 안전 위험 / Safety Risks in Fine-Tuning LLMs (6 minute read)

연구원들은 메타의 라마(Llama)나 OpenAI의 GPT-3.5 터보와 같이 사전 학습된 대규모 언어 모델을 추가로 커스터마이징할 때 발생할 수 있는 잠재적인 안전 문제를 강조합니다. llm-finetuning

Researchers highlight potential safety issues when further customizing pre-trained large language models like Meta's Llama and OpenAI's GPT-3.5 Turbo.

슬로우라마 / SlowLlama (GitHub Repo)

정량화 없이 MacBook Air에서 Llama2-70b 및 CodeLlama를 미세 조정합니다.

Finetune Llama2-70b and CodeLlama on a MacBook Air without quantization.

(더 읽어보기 :point_right: [GN] SlowLlama - Llama2-70b 와 CodeLLama를 M1/M2에서 양자화없이 파인튜닝)

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

MathCoder: 새로운 AI 모델의 수학 풀이 능력 / Math Solving Abilities in New AI Models (16 minute read)

연구원들은 오픈소스 AI 모델에 코드를 사용하도록 교육하여 수학 해결 능력을 향상시키는 새로운 기술을 개발했습니다. mathematical-analysis mathematical-reasoning wizardmath

Researchers have developed a new technique to boost the math-solving skills of open-source AI models by teaching them to use code.

MLAgentBench: 머신 러닝 실험을 수행하기 위한 새로운 벤치마크 / A New Benchmark to Conduct Machine Learning Experiments (28 minute read)

이 백서에서는 AI가 인간 연구자처럼 머신러닝 실험을 수행할 수 있는 시험대인 MLAgentBench를 소개합니다.

This paper introduces MLAgentBench, a testing ground for AI to conduct machine learning experiments, just like human researchers.

LightSeq: 긴 컨텍스트 LLM 학습을 위한 보다 효율적인 시스템 / LightSeq: A More Efficient System for Training Long-Context LLMs (18 minute read)

LightSeq은 확장된 컨텍스트 길이를 가진 대규모 언어 모델을 훈련하는 새로운 방법으로, Megatron-LM과 같은 이전 시스템의 한계를 해결합니다. long-context

LightSeq is a novel method for training large language models with extended context lengths that addresses the limitations of previous systems like Megatron-LM.

:gift: 그 외 소식 / Miscellaneous

StableLM 3B에서 데이터 반복 / StableLM 3B with data repeating (8 minute read)

스테이블리티는 데이터 반복을 테스트하기 위해 이번에는 4T 토큰으로 또 다른 모델을 학습시켰습니다. 또한 대중의 반발로 인해 데이터 믹스에서 북스3를 제거했습니다.

Stability has trained another model, this time on 4T tokens to test data repeating. Also, due to public pushback, they removed Books3 from the data mix.

오픈소스 AI 비즈니스 모델 및 브랜드 해자 / Open Source AI Business Models & Brand Moats (9 minute read)

우리는 지난 25년 이상 오픈소스 모델이 어떻게 작동하고 성공할 수 있는지 보아왔습니다. 오픈 소스 모델이 성숙해지고 더 "폐쇄적"이 되어가더라도 오픈 소스 모델은 지속적인 영향을 미칩니다. AI의 시대에는 모든 플레이북이 동일하지 않습니다. 이 글은 오픈소스 모델과 그 안에서 AI가 어떤 역할을 할 것인지에 대한 사려 깊고 심도 있는 검토입니다. open-source

We’ve seen how open source models can work and thrive over the last 25+ years. Even as they mature and become more “closed”, the open source model has lasting impacts. In the face of AI, not all playbooks are the same. This is a thoughtful and in-depth review of open source models and how AI will play in this.

AI 번들 해제 / Unbundling AI (10 minute read)

AI의 광범위한 잠재력은 실제 활용도와 신뢰성에 대한 의문을 불러일으킵니다. 기술이 발전함에 따라 일반화된 솔루션에서 특정 용도로 정의된 솔루션으로 전환해야 할 것입니다.

AI’s broad potential raises questions about its real-world utility and reliability. As the technology matures, its evolution will require a shift from a generalized solution to one with defined, specific applications.

:zap: 더 읽어보기 / Quick Links

Intently (Product)

이상적인 고객 프로필을 검증하고, 파이프라인에 적합한 유사 리드를 찾고, 행동 데이터로 주요 계정을 추적하여 LinkedIn 활동을 영업 기회로 전환하세요.

Turn LinkedIn actions into sales opportunities by validating your ideal customer profile, finding look-alike leads for your pipeline, and tracking key accounts with behavioral data.

DataLens (GitHub Repo)

최신 비즈니스 인텔리전스 및 데이터 시각화 시스템입니다.

A modern business intelligence and data visualization system.

OpenAI, 파이썬 SDK 출시 / OpenAI To Release Its Python SDK (2 minute read)

파이썬 개발자를 위한 OpenAI API에 대한 액세스를 개선하기 위한 중요한 단계로, OpenAI가 파이썬 SDK의 베타 버전을 공개했습니다.

OpenAI has unveiled the Beta version of its Python SDK, marking a significant step towards enhancing access to the OpenAI API for Python developers.