[TLDR] 오늘의 AI 뉴스, 2023-10-11: 어도비 포토샵 AI 📷, 의사를 위한 마이크로소프트 AI 🏥, 동영상 이해를 위한 LLM 📺

:rocket: 주요 뉴스 & 신규 출시 소식 / Headlines & Launches

Adobe, AI 도구로 포토샵을 강화하다 / Adobe Beefs Up Photoshop With AI Tools (1 minute read)

Adobe는 Firefly 기반의 AI 툴이 탑재된 공식 웹 버전의 Photoshop을 출시했습니다. adobe-photoshop-ai

Adobe has released the official web version of Photoshop, equipped with AI tools powered by Firefly.

Microsoft, 의사를 지원하는 새로운 AI 도구 발표 / Microsoft Announces New AI Tools To Assist Doctors (2 minute read)

Microsoft는 의료 기관이 방대한 의료 데이터를 통합하고 해석할 수 있도록 Microsoft Fabric 및 Azure AI에 새로운 AI 도구를 도입했습니다. azure-ai-studio microsoft

Microsoft introduced new AI tools in Microsoft Fabric and Azure AI to help healthcare organizations consolidate and interpret vast medical data.

미국, EU의 획기적인 AI 정책이 빅 테크에만 혜택을 줄 것이라고 경고 / US Warns EU’s Landmark AI Policy Will Only Benefit Big Tech (6 minute read)

미국은 EU가 제안한 AI 규제가 자원이 풍부한 기업에 유리하고 소규모 기업에 피해를 줄 수 있다고 경고합니다. 미국은 EU가 모델 사용의 위험성보다는 AI 모델 개발에 초점을 맞추고 있다고 비판하며, 이는 EU의 투자와 AI R&D를 저해할 수 있다고 분석합니다. AI 목표의 조율과 공유를 목표로 논쟁이 계속되고 있습니다. ai-regulation ai-act

The US warns the EU that its proposed AI regulations could favor well-resourced companies and hurt smaller ones. Washington's analysis criticizes the EU's focus on AI model development rather than the risk of model use, suggesting it could deter investment and AI R&D in the EU. The debate continues, aiming for alignment and shared AI objectives.

:brain: 연구 & 혁신 관련 소식 / Research & Innovation

새로운 비디오 토큰화를 통한 시각적 생성 개선 / Improving Visual Generation with a New Video Tokenization (2 minute read)

이 연구에서는 이미지와 비디오 입력을 대규모 언어 모델용 토큰으로 효율적으로 변환하는 비디오 토큰화 도구인 MAGVIT-v2를 소개합니다. MAGVIT-v2를 사용하면 LLM은 시각 생성 작업에서 확산 모델의 성능을 능가합니다.

This study introduces MAGVIT-v2, a video tokenizer that efficiently translates image and video inputs into tokens for Large Language Models. With MAGVIT-v2, LLMs surpass the performance of diffusion models in visual generation tasks.

DiffuSeq-v2: 텍스트 생성을 위한, 속도가 향상된 확산 모델 / Speeding Up Diffusion Models for Text Generation (7 minute read)

연구원들이 텍스트 생성에 사용되는 확산 모델에 대한 새로운 기술을 소개합니다. 연구진은 소프트 흡수 상태를 사용하여 모델이 불연속적인 텍스트 변화를 처리하는 방식을 개선함으로써 학습 속도가 빨라지고 샘플링 속도가 빨라졌습니다.

Researchers introduce a new technique for diffusion models used in text generation. By using a soft absorbing state, they improved how the model handled discrete text changes, resulting in faster learning and quicker sampling.

Auction Arena: 경쟁이 치열한 경매 세계에서 LLM 테스트하기 / Testing LLMs in the Competitive World of Auctions (GitHub Repo)

연구원들은 역동적이고 전략적 사고가 필요한 경매 환경에서 대규모 언어 모델을 테스트하기 위해 설계된 시뮬레이션 플랫폼인 AucArena를 만들었습니다. 초기 테스트 결과, 적절한 프롬프트를 제공하면 이러한 모델이 경매에서 예산 책정 및 장기 계획과 같은 기술을 보여주며 인상적인 성과를 거둘 수 있는 것으로 나타났습니다.

Researchers have created AucArena, a simulation platform designed to test Large Language Models in auction settings, which are dynamic and require strategic thinking. Initial tests show that, with the right prompts, these models can perform impressively in auctions, showing skills like budgeting and long-term planning.

:man_technologist: 엔지니어링 및 리소스 관련 소식 / Engineering & Resources

인간 대 로봇 모션 리타겟팅 / Human to robot motion retargeting (18 minute read)

연구자들은 딥러닝 인코더를 사용하여 사람의 동작을 로봇에 전송할 수 있었습니다. 이 작업은 일반적으로 로봇에 맞게 보정해야 하는 특수 하드웨어를 통해 이루어집니다. 이를 비디오 기반 모션 캡처와 결합하면 멋진 미래 프로젝트가 될 수 있습니다!

Researchers have been able to transfer human motion onto robots by using a deep learning encoder. This is usually done with specialized hardware that has to be calibrated to the robot. Combining this with video-based motion capture could be a cool future project!

FAVOR: 비디오 이해도 향상을 위한 LLM 활용하기 / Leverage LLMs for Enhanced Video Understanding (18 minute read)

연구원들은 프레임 수준에서 오디오와 시각적 세부 사항을 미세하게 혼합하여 대규모 언어 모델이 동영상을 이해할 수 있도록 하는 새로운 접근 방식인 FAVOR를 도입했습니다. llm videochat

Researchers have introduced FAVOR, a new approach that allows large language models to understand videos by finely blending audio and visual details at the frame level.

MuggleMath: LLM의 수학적 추론 능력 향상 / Boosting Mathematical Reasoning of LLMs (17 minute read)

연구원들은 데이터 증강 기술이 대규모 언어 모델의 수학 추론 능력을 향상시키는 데 미치는 영향을 조사합니다. 이들은 기존 데이터 세트의 쿼리를 개선하고 MuggleMath라는 모델을 개발하여 새로운 데이터 세트인 AugGSM8K를 생성합니다. mathglm mathematical-analysis wizardmath

Researchers investigate the impact of data augmentation techniques on improving the math reasoning capabilities of large language models. They create a new dataset, AugGSM8K, by enhancing queries from an existing dataset and developing a model named MuggleMath.

:gift: 그 외 소식 / Miscellaneous

결함이 있는 시험 점수에 기반한 AI 과대 광고 / AI Hype Is Built On Flawed Test Scores (8 minute read)

점점 더 많은 연구자들이 인간 시험에 기계로 점수를 매기는 관행이 잘못되었다고 생각하며, 보다 엄격하고 철저한 평가를 요구하며 LLM 평가 방식을 개편하고자 합니다. llm-evaluation

A growing number of researchers want to overhaul the way LLMs are assessed, calling for more rigorous and exhaustive evaluation, as they believe the practice of scoring machines on human tests is misguided.

SaaS 기업이 AI를 사용하여 앞서 나갈 수 있는 8가지 방법 / 8 ways SaaS companies can use AI to get ahead (12 minute read)

작업 자동화부터 코드 작성까지, AI는 고객 데이터를 분석하고 제품을 구축하는 방식에 활용도를 더해가고 있습니다. 여기서 중요한 점은 AI를 통해 사람들이 더 많은 일을 할 수 있게 되었으며, 이를 활용하지 않으면 경쟁에서 뒤처질 가능성이 높다는 것입니다. ai-saas enterprise-saas

From task automation to writing code, AI is adding leverage to how we analyze customer data and build products. The key takeaway here is that AI is enabling people to do a lot more, and if you’re not using it, you’re likely going to get outpaced by your competition.

피부색의 중요한 측면에 대한 AI 편향성 테스트 / AI bias tests gloss over a crucial aspect of skin color (5 minute read)

소니의 AI 연구는 피부색을 측정할 때 밝기/어두움뿐만 아니라 빨간색과 노란색 색조를 강조하는 보다 '다차원적인' 접근 방식을 제안합니다. 현재의 척도는 특정 인종 그룹에 대한 편견을 간과할 수 있습니다. 소니는 CIELAB 컬러 표준을 권장하지만, 다른 업체에서는 Monk Skin Tone Scale과 같은 시스템의 단순성을 선전하기도 합니다. 구글과 아마존은 소니의 연구 결과를 검토하고 있습니다.

Sony's AI research suggests a more "multidimensional" approach to measuring skin color, emphasizing not just lightness/darkness but also red and yellow hues. Current scales might overlook biases against certain ethnic groups. Sony recommends the CIELAB color standard, even as others tout the simplicity of systems like the Monk Skin Tone Scale. Google and Amazon are reviewing Sony's findings.

:zap: 더 읽어보기 / Quick Links

차세대 AI 툴을 미리 엿볼 수 있는 Adobe의 프로젝트 스타더스트 / Adobe’s Project Stardust Is A Sneak Preview Of Its Next Gen AI Tools (1 minute read)

Adobe는 MAX 컨퍼런스에서 AI 기반 사진 편집기인 프로젝트 스타더스트의 미리보기를 공개했습니다. 반딧불이 모델 2를 사용하는 스타더스트는 사용자가 손쉽게 장면을 수정하고, 배경을 바꾸고, 개체를 제거할 수 있습니다.

Adobe unveiled a sneak preview of Project Stardust, an AI-powered photo editor, at its MAX conference. Using the Firefly Model 2, Stardust lets users effortlessly modify scenes, replace backgrounds, and remove objects.

사용자당 월 평균 20달러의 손실을 입는 GitHub Copilot / GitHub Copilot Loses an Average of $20 Per User Per Month (2 minute read)

GitHub Copilot은 사용자에게 월 10달러의 비용이 들지만, Microsoft는 사용자당 월 평균 20달러의 비용을 지출하고 있습니다. 일부 사용자는 한 달에 80달러까지 비용을 지불하고 있습니다. 이 때문에 Microsoft는 Microsoft 365 Copilot의 AI 기능에 대해 더 많은 비용을 청구하기로 결정했을 가능성이 높습니다. 이 비용 때문에 Microsoft는 데이터 센터를 위한 자체 AI 칩 세트를 개발하고 업계 전반에 걸쳐 신경 처리 장치 채택을 추진하고 있는 것으로 보입니다. copilot copilot-chat github-copilot

GitHub Copilot costs users $10 per month, but it is costing Microsoft an average of $20 per user per month. Some users are costing the company as much as $80 per month. This is likely why Microsoft decided to charge a lot more for the AI capabilities in Microsoft 365 Copilot. The costs are also likely why the company is developing its own in-house AI chip sets for its data centers and pushing the adoption of Neural Processing Units across the industry.