[TLDR] 오늘의 AI 뉴스, 2023-06-26: 구글: AudioPaLM 출시 🔊, 마이크로소프트: LLM 교육 및 서비스 발전 💻, 코드 모델이 자가 복구를 할 수 있을까❓

:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

Google, AudioPaLM 출시 / Google Releases AudioPaLM (7 minute read)

Google은 음성 이해 및 생성을 위한 대규모 언어 모델 AudioPaLM을 출시했습니다. AudioPaLM은 텍스트 기반 및 음성 기반 언어 모델을 통합된 멀티모달 아키텍처로 통합하여 텍스트와 음성을 처리하고 생성할 수 있으며, 음성 인식 및 음성 대 음성 번역을 포함한 애플리케이션을 지원합니다.

Google has introduced AudioPaLM, a large language model for speech understanding and generation. AudioPaLM fuses text-based and speech-based language models into a unified multimodal architecture that can process and generate text and speech, with applications including speech recognition and speech-to-speech translation.

Microsoft, LLM 학습 및 서빙을 위한 최첨단 기술 / Microsoft advances state of the art for LLM training and serving (7 minute read)

DeepSpeed는 가장 큰 규모의 오픈 모델들을 학습하는 데 사용된 알고리즘 및 시스템입니다. 메모리, 처리량, 사용성이 개선되어 이제 막 업그레이드되었습니다. DeepSpeed는 AI 분야에서 일하는 대부분의 개발자가 사용하는 표준 툴킷입니다.

DeepSpeed is an algorithm and system that has been used to train some of the largest open models. With improvements to memory, throughput, and usability, it just got an upgrade. DeepSpeed is a standard piece of the toolkit for most developers working in AI.

AI 아티스트를 놀라게 한 Midjourney 업데이트 / Midjourney Update Wows AI Artists (5 minute read)

Midjourney는 AI 기반 이미지 합성 모델의 버전 5.2를 공개했는데, 여기에는 합성된 중앙 이미지를 유지하면서 그 주위에 더 큰 장면을 자동으로 구축하여 카메라 렌즈로 축소하는 것처럼 시뮬레이션할 수 있는 새로운 '줌아웃' 기능이 포함되어 있습니다.

Midjourney unveiled version 5.2 of its AI-powered image synthesis model, which includes a new "zoom out" feature that allows maintaining a central synthesized image while automatically building out a larger scene around it, simulating zooming out with a camera lens.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

가짜 뉴스를 발견하는 도구 / A Tool to Spot Fake News (GitHub Repo)

3HAN은 가짜 뉴스를 발견하는 데 도움을 주기 위해 만들어진 새로운 도구입니다. 이 도구는 기사를 단어, 문장, 헤드라인으로 세분화하여 '뉴스 벡터' 또는 기사 표현을 만들 때 가장 중요한 부분에 특히 주의를 기울입니다. 3HAN은 가짜 뉴스를 탐지하는 데 매우 효과적인 것으로 입증되었으며, 기사의 핵심 부분을 강조 표시하여 추가적인 사실 확인을 할 수도 있습니다.

3HAN is a new tool created to help spot fake news. It takes an article and breaks it down into its words, sentences, and headline, paying extra attention to the most important parts when creating a "news vector" or representation of the article. 3HAN has proven to be very effective at detecting fake news and can even highlight the key parts of an article for further human fact-checking.

검증된 컴퓨터 비전 툴킷 / Vetted computer vision toolkits (3 minute read)

최고의 컴퓨터 비전 모델 중 상당수가 TIMM에 포함되어 있지만, 프로덕션 시스템으로 작업할 때는 그 이상의 것이 필요한 경우가 많습니다. OpenMMlab에는 포즈 및 세분화와 같은 다양한 비전 작업을 위한 고품질 시스템 세트가 있습니다

Many of the top computer vision models live in TIMM, but when working with production systems, you often need a bit more. OpenMMlab has a set of high quality systems for a variety of vision tasks like pose and segmentation

ExLlama (GitHub Repo)

양자화된 가중치와 함께 사용하기 위해 Llama의 허깅페이스 트랜스포머 구현을 보다 메모리 효율적으로 재작성한 것입니다.

A more memory-efficient rewrite of the HF transformers implementation of Llama for use with quantized weights.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

SoftGPT: 로봇에게 섬세한 물건 다루기 교육하기 / SoftGPT: Teaching Robots to Handle Delicate Things (7 minute read)

SoftGPT는 로봇이 가정에서 흔히 볼 수 있는 옷이나 베개와 같이 부드럽고 변하기 쉬운 물체를 다루는 방법을 학습하는 데 도움이 되는 모델로, 일반적으로 로봇에게는 까다로운 작업입니다. 많은 탐색 데이터로 학습된 이 모델을 통해 로봇은 물체의 모양과 움직임을 이해하고 동작의 결과를 예측할 수 있습니다.

SoftGPT is a model that helps robots learn to handle soft, changeable objects (like clothes or pillows) which are often found in homes, a task that's usually tricky for robots. This model, trained with lots of exploration data, enables robots to understand object shape and movement and predict the outcome of actions.

이미지 편집을 위한 disentanglement / Disentanglement is back for image editing (17 minute read)

Disentanglement를 학습하는 것은 컴퓨터 비전 분야에서 흥미로운 연구 분야였습니다. CLIP과 같은 대규모 대조 방식이 등장하면서 한동안 이 분야는 한동안 침체기를 겪었습니다. 하지만 이제 오픈 소스 디퓨젼 모델을 통해 텍스트 토큰의 힘을 이용해 이미지에서 객체의 얽힘을 풀고 AI가 생성한 이미지를 단일 이미지로 편집할 수 있게 되었습니다.

Learning disentangled representation was an exciting area of research in computer vision. Large scale contrastive methods like CLIP took the wind out of those sales for a while. However, now, with open source diffusion models, we can use the power of text tokens to disentangle objects in an image and allow for single image editing for AI generated images.

최신 코드 모델은 스스로 복구할 수 있을까 / Can modern code models self repair? (25 minute read)

프로그램 합성은 컴퓨터 코드를 자동으로 작성하는 프로세스입니다. GPT-4, Turbo, WizardCoder, StarCoder와 같은 최고의 모델 대부분은 코드 작성에 능숙합니다. 그러나 많은 모델들은 코드가 잘못되었을 때 스스로 복구하지 못합니다. 이 논문에서는 자가 복구 능력을 측정한 결과, GPT-4가 유일하게 자가 복구가 가능한 모델 중 하나임을 발견했습니다. 제 생각에는 이것은 OpenAI에 의해 명시적으로 학습된 것으로, 자연발생적인 것이 아닌 것으로 보입니다.

Program synthesis is the process of writing computer code automatically. Most of the best models like GPT-4, Turbo, WizardCoder, and StarCoder are great at writing code. However, many models fail to repair their own code when it is wrong. This paper measures self repair ability and finds that GPT-4 is one of the only models that exhibits self repair. My guess is this was explicitly trained for by OpenAI and not emergent.

:gift: 그 외 소식 / Miscellaneous

AI에 대한 더 큰 접근 방식은 한계에 다다랐다 / The Bigger-Is-Better Approach To AI Is Running Out Of Road (4 minute read)

점점 더 큰 모델을 구축하는 전통적인 AI 접근 방식은 이러한 모델을 학습하고 배포하는 데 드는 높은 비용으로 인해 한계에 도달하고 있습니다. 그 결과, 연구자들은 이제 단순히 모델을 더 크게 만드는 것이 아니라 더 효율적으로 만드는 데 관심을 돌리고 있습니다. 이는 막대한 리소스 없이도 모델이 초인적인 성능을 달성할 수 있는 새로운 AI 개발 시대로 이어질 수 있습니다.

The traditional approach to AI, which involves building ever-larger models, is reaching its limits due to the high cost of training and deploying these models. As a result, researchers are now turning their attention to making AI models more efficient, rather than simply bigger. This could lead to a new era of AI development, where models are able to achieve superhuman performance without requiring massive amounts of resources.

GPT-4의 비밀이 밝혀졌다 / GPT-4’s Secret Has Been Revealed (5 minute read)

아직 공식적으로 확인되지 않은 소식, GPT-4가 하나의 큰 모델이 아니라 여러 개의 작은 모델이 혼합되어 있다는 사실에 대한 탐구.

An exploration into the yet-to-be-officially-confirmed news that GPT-4 is not one large model, but a mixture of smaller models.

AI, 그리고 지식의 버거움 / AI And The Burden Of Knowledge (10 minute read)

AI는 우리가 지식에 대해 생각하는 방식을 근본적으로 바꾸고 있습니다. 과거에는 지식이 희소하고 습득하기 어려웠습니다. 하지만 AI를 통해 방대한 양의 정보에 빠르고 쉽게 접근하고 처리할 수 있게 되었습니다. 이로 인해 우리는 점점 더 다양한 주제에 대해 더 많은 것을 알아야 하는 새로운 '지식의 부담'을 안게 되었습니다.

AI is fundamentally changing the way we think about knowledge. In the past, knowledge was scarce and difficult to acquire. However, AI is making it possible to access and process vast amounts of information quickly and easily. This is leading to a new "burden of knowledge," where we are expected to know more and more about a wider range of topics.

:zap: 더 읽어보기 / Quick Links

마지막 AI 붐이 일자리를 없애지 않았다 / The Last AI Boom Didn’t Kill Jobs (3 minute read)

ChatGPT는 대량 해고에 대한 두려움을 불러일으키고 있지만, 여러 EU 국가를 대상으로 한 연구에 따르면 2010년대 딥러닝 붐이 실제로 일자리를 창출한 것으로 나타났습니다.

ChatGPT is stoking fears of mass layoffs, but a study of several EU countries found the deep-learning boom of the 2010s actually created job opportunities.

Amazon의 생성형 AI 플레이그라운드 오픈 / Amazon’s Generative AI Playground Is Now Open (1 minute read)

AWS는 1억 달러 규모의 생성형 AI 혁신 센터를 통해 AI 액셀러레이터 노력을 강화하고 있습니다.

AWS is stepping up its AI accelerator efforts via a $100 million Generative AI Innovation Center.

Boring Report (Product)

AI를 사용하여 뉴스에서 선정적인 내용을 제거하면서 필수 정보는 보존하는 앱.

An app that uses AI to remove sensationalism from the news while preserving essential information.

Codium (Product)

AI를 사용하여 테스트 작성을 자동화하여 품질을 개선하고 고객 가치를 높입니다.

Use AI to automate test writing for improved quality and increased customer value.