[TLDR] 오늘의 AI 뉴스 2023-05-18: 구글 코랩 AI📓, 스테이블 스튜디오 출시🎙️, 심볼릭 레이블로 학습하는 AI🏷️ 등

파이토치 한국 사용자 모임에서는 TLDR 뉴스레터의 승인을 받아 AI 소식을 DeepL로 번역하여 전합니다. :star_struck:

더 많은 AI 소식 및 정보를 공유하고 함께 성장하고 싶으시면 파이토치 한국 사용자 모임에 방문해주세요! :robot:

:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

Google, Colab AI 출시 / Google Introduces Colab AI (2 minute read)

Google은 PaLM 2 기반의 코드 모델 Codey를 사용하여 Colab에 코드 완성, 코드 생성을 위한 자연어, 코드 지원 챗봇과 같은 AI 코딩 기능을 조만간 추가할 예정입니다. 또한 Colab을 구동하는 데 사용되는 Codey 버전은 특히 Python 및 Colab 전용 용도에 맞게 맞춤화되었습니다.

Using Codey, a family of code models built on PaLM 2, Colab will soon add AI coding features like code completions, natural language to code generation and a code-assisting chatbot. Plus, the versions of Codey being used to power Colab have been customized especially for Python and for Colab-specific uses.

Stability AI, StableStudio 출시 / Stability AI Releases StableStudio (1 minute read)

Stability AI는 DreamStudio AI 텍스트-이미지 변환 웹 앱의 새로운 오픈 소스 변형인 StableStudio를 발표했습니다.

Stability AI has announced StableStudio, a new open-source variant of its DreamStudio AI text-to-image web app.

Zapier AI 공개 서한 / Zapier AI open letter (9 minute read)

Zapier는 누구나 소프트웨어 애플리케이션을 만들고 커스터마이징할 수 있는 AI 기반 자동화 도구를 개발하는 데 주력하고 있습니다. OpenAI, Leap, Vowel과 같은 AI 도구와 통합하여 운영을 간소화하고 맞춤형 소프트웨어 솔루션을 제공하는 것이 Zapier의 목표입니다. 재피어는 재피어 ChatGPT 플러그인 및 자연어 액션 API와 같은 기능을 출시했습니다. 또한 일반 영어를 사용하여 Zap을 생성하고 사용자가 코드를 작성하지 않고도 워크플로를 사용자 지정할 수 있는 두 가지 새로운 AI 베타 기능을 발표했습니다.

Zapier is focusing on developing AI-powered automation tools to allow everyone to create and customize software applications. By integrating with AI tools such as OpenAI, Leap, and Vowel, Zapier aims to streamline operations and provide tailored software solutions. The company has launched features like the Zapier ChatGPT plugin and the Natural Language Actions API. Additionally, it announced two new AI beta features: creating a Zap using plain English and allowing users to customize workflows without writing any code.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

ggml용 StarCoder / StarCoder in ggml (GitHub Repo)

GGML은 CPU에서 4비트 양자화 모델을 실행하기 위한 프레임워크입니다. 즉, 노트북에서 로컬로 매우 큰 모델을 실행할 수 있습니다. 스타코더는 최고의 오픈 소스 프로그램 합성 모델 중 하나입니다. 까다로운 OpenAI 인간 평가 벤치마크에서 매우 높은 점수를 받았습니다. 이 풀 리퀘스트는 해당 모델을 GGML 프레임워크에 추가하여 상용 하드웨어에서 스타코더를 실행할 수 있도록 합니다.

GGML is a framework for running 4-bit quantized models on the CPU. This means you can run really large models locally on your laptop. Starcoder is one of the very best open source program synthesis models. Scoring very well on the challenging OpenAI human eval benchmark. This pull request adds that model to the GGML framework which means you can run starcoder on commodity hardware.

Smol-Developer (GitHub Repo)

AI 기반 "주니어 개발자" 프로그래밍 어시스턴트.

An AI-powered “junior developer” programming assistant.

모든 LLM 개발자가 알아야 할 숫자들 / Numbers Every LLM Dev Should Know (GitHub Repo)

LLM 개발자가 알아야 할 숫자 집합으로, 백오브더엔벨로프 계산에 유용합니다.

A set of numbers for LLM developers to know that are useful for back-of-the envelope calculations.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

심볼 튜닝: 심볼 레이블로 AI 학습 강화하기 / Symbol Tuning: Enhancing AI Learning with Symbolic Labels (21 minute read)

심볼 튜닝은 AI를 학습시키는 새로운 방법으로, 일반 언어 레이블(예: '긍정' 또는 '부정')을 임의의 심볼(예: '푸' 또는 '바')로 대체하여 AI가 입력과 레이블 간의 연결을 통해 학습하도록 하는 것입니다. 이 방법은 새로운 작업에 대한 AI의 성능을 향상시키고, 지시를 더 잘 이해하도록 돕고, 논리적 추론 작업에 더 능숙하게 만들어주며, 다양한 벤치마크에서 상당한 개선이 이루어졌습니다.

Symbol tuning is a new way to train AIs, where we replace normal language labels (like "positive" or "negative") with random symbols (like "foo" or "bar"), forcing the AI to learn from the connections between inputs and labels. This method improves the AI's performance on new tasks, helps it understand instructions better, and makes it more skilled at logical reasoning tasks, with significant improvements seen across different benchmarks.

DarkBERT: 다크 웹 전문 AI 공개 / DarkBERT: Unveiling the Dark Web with a Specialized AI (18 minute read)

DarkBERT는 일반 인터넷에서 볼 수 있는 것과는 다른 다크웹에서 사용되는 고유한 언어에 대해 특별히 학습된 새로운 AI입니다. 다른 AI와 비교하고 다양한 사용 사례를 살펴본 결과, DarkBERT가 다크웹 텍스트를 더 잘 이해하고 작업할 수 있어 향후 이 분야의 연구에 유용한 도구가 될 수 있다는 사실을 발견했습니다.

DarkBERT is a new AI that's been trained specifically on the unique language used in the Dark Web, which is different from what you'd find on the regular internet. By comparing it to other AIs and looking at various use cases, we've found that DarkBERT is better at understanding and working with Dark Web text, making it a useful tool for future research in this area.

Boundless DAS: 대규모 AI 모델의 미스터리 이해하기 / Boundless DAS: Understanding the Mysteries of Large AI Models (14 minute read)

바운드리스 DAS는 알파카와 같은 대규모 AI 모델이 내부에서 어떻게 작동하는지 더 잘 이해하기 위해 개발한 새로운 방법으로, 해당 모델의 행동에서 이해할 수 있는 패턴을 찾습니다. 알파카는 입력이나 명령이 무엇이든 상관없이 이해할 수 있는 두 가지 변수를 일관된 방식으로 사용하여 간단한 숫자 문제를 해결한다는 사실을 발견했으며, 이는 복잡한 AI 모델이 실제로 어떻게 작동하는지 이해하는 데 중요한 단계입니다.

Boundless DAS is a new method we've developed to better understand how large AI models, like Alpaca, work on the inside, by looking for understandable patterns in their behavior. We've found that Alpaca solves a simple number problem by using two understandable variables in a consistent way, no matter what the inputs or instructions are, which is an important step towards understanding how these complex AI models really work.

:gift: 그 외 소식 / Miscellaneous

인플루언서의 AI 클론이 여자친구가 되어주는데 분당 $1 / An influencers AI Clone Will Be Your Girlfriend For $1/Min (4 minute read)

소셜 미디어 인플루언서 Caryn Marjorie는 OpenAI가 개발한 GPT-4 API 기술을 활용하여 자신의 목소리, 매너리즘, 개성을 복제하는 AI 챗봇인 CarynAI를 출시했습니다. 팬들은 1분에 1달러를 내면 마치 마조리와 직접 대화하는 듯한 '몰입형 AI 경험'을 통해 CarynAI와 채팅할 수 있습니다.

Caryn Marjorie, a social media influencer, launched CarynAI, an AI chatbot leveraging GPT-4 API technology developed by OpenAI that replicates her voice, mannerisms and personality. For $1 a minute, fans can chat with CarynAI in an “immersive AI experience” that feels almost like speaking to Marjorie herself.

OpenAI, 정치에서 ChatGPT 사용 금지 / OpenAI Bans ChatGPT Use In Politics (2 minute read)

OpenAI는 워싱턴 로비스트와 정책 옹호자들에게 데이터를 제공하는 한 선도적인 회사에 정치에 ChatGPT를 사용하는 광고를 할 수 없다고 말했습니다.

OpenAI told a leading company that provides data to Washington lobbyists and policy advocates that it can’t advertise using ChatGPT for politics.

PaLM 2의 학습 / The Training Of PaLM 2 (2 minute read)

구글의 새로운 대규모 언어 모델인 PaLM 2는 2022년부터 이전 모델보다 거의 5배 많은 훈련 데이터를 사용하여 더 고급 코딩, 수학 및 창의적 글쓰기 작업을 수행할 수 있습니다.

Google’s new large language model PaLM 2, uses almost five times as much training data as its predecessor from 2022, allowing it to perform more advanced coding, math and creative writing tasks.

:zap: 더 읽어보기 / Quick Links

Google AI 광고 / Google AI Ads (2 minute read)

구글은 광고주와 YouTube 크리에이터를 돕기 위해 여러 광고 관련 인공 지능 프로젝트를 승인했다고 내부 문서에 나와 있습니다.

Google has approved several ad-related artificial intelligence projects to help advertisers and YouTube creators, internal documents show.

딥페이크 스타트업에 몰리는 VC / Deepfake Startups Become A Focus For VCs (4 minute read)

VC 펀드는 2017년 100만 달러에 불과했던 딥페이크 분야에 작년에 1억 8,770만 달러를 투자했습니다.

VC funds invested $187.7 million in the deepfake space last year, up from just $1 million in 2017.

Google, AI 신약 개발 도구 발표 / Google Announces AI Drug Discovery Tools (1 minute read)

구글 클라우드는 AI 기능으로 강화된 새로운 의료 연구 제품을 선보이고 있습니다. 주요 제품에는 비정형 텍스트에서 의료 정보를 추출하기 위한 헬스케어 자연어 API와 맞춤형 엔티티 추출을 위한 헬스케어용 AutoML 엔티티 추출이 포함됩니다. 이러한 도구는 복잡한 의료 데이터에서 인사이트를 얻는 프로세스를 간소화하여 잠재적으로 더 정확하고시기 적절한 환자 치료를 가능하게합니다.

Google Cloud is introducing new healthcare research products, enhanced with AI capabilities. Key offerings include the Healthcare Natural Language API for extracting medical information from unstructured text, and AutoML Entity Extraction for Healthcare for customized entity extraction. These tools will streamline the process of gleaning insights from complex healthcare data, potentially enabling more precise and timely patient care.

Amazon, 새로운 AI 가젯 공개 / Amazon Unveils New AI Gadgets (1 minute read)

아마존은 업데이트된 에코 디바이스 슬레이트를 소개하고 알렉사 기반 가젯에 ChatGPT 스타일의 인공 지능을 제공하겠다고 약속했습니다.

Amazon.com Inc. introduced an updated slate of Echo devices and pledged to bring ChatGPT-style artificial intelligence to Alexa-powered gadgets.