주요 뉴스 & 신규 출시 소식 / Headlines & Launches
AI를 위한 데이터센터, 빠른 성장을 위한 준비 완료 / AI-Ready Data Centers Are Poised for Fast Growth (6 minute read)
기업들은 급증하는 AI 애플리케이션 수요를 수용하기 위해 AI 전문 데이터센터에 막대한 투자를 하고 있습니다. AI 인프라 시장은 2029년까지 4,225억 5,000만 달러 규모로 성장할 것으로 예상됩니다. 특히 데이터센터 스타트업인 CoreWeave는 AI 지원 데이터센터 구축을 확장하기 위해 23억 달러의 자금을 확보했습니다. 메타 플랫폼과 같은 다른 업계 대기업들도 AI 데이터센터 프로젝트를 재고하고 있습니다.
Companies are investing heavily in AI-specialized data centers to accommodate the surging demand for AI applications. The AI infrastructure market is projected to grow to $422.55 billion by 2029. Notably, data-center startup CoreWeave secured $2.3 billion in funding to expand its AI-ready data center construction. Other industry giants like Meta Platforms are reconsidering their AI data center projects.
Microsoft의 Bing Chat, 타사 브라우저에서도 사용 가능 / Microsoft’s Bing Chat Is Coming To Third-Party Browsers (2 minute read)
Microsoft는 곧 데스크톱 및 모바일 디바이스용 타사 브라우저에서 Bing Chat을 사용할 수 있게 될 것이라고 발표했습니다.
Microsoft has announced that Bing Chat will soon be available in third-party browsers for both desktop and mobile devices.
Salesforce 아인슈타인 스튜디오로 Amazon SageMaker의 자체 모델을 가져올 수 있습니다. / Salesforce Einstein Studio lets you bring your own model, starting with Amazon SageMaker (5 minute read)
Salesforce는 고객이 데이터 추출, 변환 및 로딩 없이 자체 모델을 Data Cloud로 가져올 수 있는 관리 콘솔인 Einstein Studio의 출시를 발표했습니다. 이 기능은 SageMaker와 같은 다른 플랫폼에서 이미 모델을 구축한 정교한 데이터 팀을 보유한 기업을 대상으로 합니다.
Salesforce has announced the release of Einstein Studio, a management console that allows customers to import their own models into Data Cloud without the need for data extraction, transformation, and loading. This feature is aimed at companies with sophisticated data teams who have already built models in other platforms like SageMaker.
연구 & 혁신 관련 소식 / Research & Innovation
LanceDB - 오픈소스, 서버리스 벡터 데이터베이스 2.0 / LanceDB - open-source, serverless vector database 2.0 (Github Repo)
LanceDB는 AI 애플리케이션을 위한 새로운 개발자 친화적인 서버리스 벡터 데이터베이스입니다. 관리할 서버 없이 앱에 내장할 수 있으며, 메모리가 아닌 온디스크로 확장되어 지연 시간이 짧습니다. LanceDB는 벡터 검색, 전체 텍스트 검색, SQL을 지원하며 멀티 모달 데이터에 최적화되어 있습니다.
LanceDB is a new developer-friendly and serverless vector database for AI applications. It can be embedded into apps with no servers to manage and it scales on-disk rather than memory with low latency. LanceDB has support for vector search, full text search, and SQL and is optimized for multi-modal data.
HF 트랜스포머의 분류기 없는 유도 / Classifier Free Guidance in HF Transformers (GitHub Pull Request)
분류기-없는-유도 방식은 모델 생성을 유도하는 방법입니다. 이미지 생성에 많이 사용됩니다. 텍스트에도 잘 작동하며 이제 Hugging Face 모델의 .generate()
메서드에서 사용할 수 있습니다.
Classifier free guidance is a way to steer generation of models. It is used heavily in image generation. It also works well for text and now is supported in the
methods of Hugging Face models.
MM-Vet: 멀티모달 LLM을 테스트하는 새로운 방법 / A New Way to Test Multimodal LLMs (GitHub Repo)
MM-Vet은 사진으로 수학 문제를 풀거나 사진 속 농담을 설명하는 등 이미지와 단어가 모두 포함된 작업을 LLM이 얼마나 잘 처리할 수 있는지 테스트하는 새로운 툴입니다.
MM-Vet is a new tool that tests how well LLMs can handle tasks that involve both images and words, like figuring out math problems from a photo or explaining jokes in pictures.
엔지니어링 및 리소스 관련 소식 / Engineering & Resources
더 공정한 평가를 위한 LLM 평가 개선 / Improving LLM Evaluation for Fairer Assessments (16 minute read)
연구자들은 학술 논문 검토 프로세스를 모방한 심층 네트워크를 사용하는 새로운 LLM 평가 접근법을 제안했습니다. 다양한 관점을 나타내는 여러 계층과 뉴런을 사용하면 보다 포괄적인 평가가 가능합니다.
Researchers have proposed a new approach for evaluating LLMs that uses deep networks that mimic academic paper review processes. Using multiple layers and neurons that represent different perspectives results in more comprehensive evaluations.
VisAlign: AI-인간 시각적 정렬을 위한 데이터셋 / A Dataset for AI-Human Visual Alignment (22 minute read)
이 논문에서는 AI가 인간처럼 이미지를 "보는"지 확인하기 위한 데이터세트를 소개합니다. 이 데이터 세트는 선명하거나 불분명하거나 흐릿한 이미지에 대한 AI의 의사 결정을 테스트하기 위해 설계된 세 가지 주요 그룹(반드시 실행, 반드시 금지, 불확실)으로 구성됩니다.
This paper introduces a dataset to see if AI "sees" images like humans do. The dataset has three main groups - Must-Act, Must-Abstain, and Uncertain - designed to test AI's decision-making on clear, unclear, or blurry images.
MiniChain (GitHub Repo)
이 체인 도구는 프로토타이핑과 프로덕션 모두에 실제로 유용한 최초의 도구일 수 있습니다. 이 도구는 함수 데코레이터와 YAML 템플릿을 영리하고 강력한 방식으로 사용하여 체인화를 가능하게 합니다. 예시를 통해 단 20줄로 채팅 봇, 벡터 데이터베이스 등을 작성할 수 있음을 확인할 수 있습니다.
This chaining tool might be the first actually truly useful one for both prototyping and production. It uses function decorators and YAML templates in a clever and powerful way to enable chaining. Examples show that you can write a chat bot, vector database, and more in just 20 lines.
그 외 소식 / Miscellaneous
AI 연구자 제프리 힌튼, 'AI가 감정을 가지고 있거나 가질 것' / AI researcher Geoffrey Hinton thinks AI has or will have emotions (3 minute read)
AI 연구원 Geoffrey Hinton은 감정과 관련된 가상의 행동을 설명할 수 있기 때문에 미래에는 AI 시스템이 좌절감이나 분노와 같은 감정을 느낄 수 있을 것이라고 믿습니다.
AI researcher Geoffrey Hinton believes that AI systems will be able to feel emotions such as frustration and anger in the future because they can narrate hypothetical actions associated with emotions.
AI 언어 모델, 정치적 편견이 가득 / AI Language Models Are Rife With Political Biases (5 minute read)
새로운 연구에 따르면 어떤 LLM을 사용하느냐에 따라 다양한 정치적 편향이 담긴 답변을 얻을 수 있으며, GPT-4는 가장 좌파적인 자유주의자이고 LLaMA는 가장 우파적인 권위주의자라고 합니다.
New research has shown that depending on which LLM you use, you will get answers charged with differing political biases, with GPT-4 the most left-wing libertarian and LLaMA the most right-wing authoritarian.
WebGPU용으로 PyTorch를 다시 구현한 방법 / How I Re-implemented PyTorch for WebGPU (6 minute read)
WebGPU-Torch는 브라우저에서 리눅스 워크스테이션과 비슷한 속도로 신경망을 실행할 수 있게 해주는 타입스크립트 라이브러리입니다. PyTorch의 API와 일치하는 것을 목표로 하는 이 라이브러리는 WebGPU를 사용하여 구현되며 최적화된 추론 및 오토그래드 기능을 제공합니다. 저자는 WebGPU를 위한 기본 연산을 다시 구현하고 코드 생성기를 활용하여 메모리 레이아웃과 커널을 최적화했습니다.
WebGPU-Torch is a TypeScript library that enables running neural networks in the browser at speeds comparable to a Linux workstation. The library, which aims to match PyTorch's API, is implemented using WebGPU and offers optimized inference and autograd capabilities. The author re-implemented basic operations for WebGPU and utilized a code generator to optimize memory layout and kernels.
더 읽어보기 / Quick Links
TorchScale (GitHub Repo)
TorchScale은 연구자와 개발자가 트랜스포머를 효율적이고 효과적으로 확장할 수 있게 해주는 PyTorch 라이브러리입니다.
TorchScale is a PyTorch library that allows researchers and developers to scale up Transformers efficiently and effectively.
Artie (Product)
Artie는 데이터베이스에서 데이터 웨어하우스로의 실시간 데이터 스트리밍 솔루션입니다. 변경 데이터 캡처 및 스트림 처리를 활용하여 보다 효율적인 방식으로 데이터 전송을 수행함으로써 1분 미만의 지연 시간을 구현하고 데이터 웨어하우스 네트워킹 비용을 절감할 수 있습니다.
Artie is a real time data streaming solution for databases to data warehouses. It leverages change data capture and stream processing to perform data transfers in a more efficient way, enabling sub-minute latency and lowering data warehouse networking costs.
이제 OpenAI의 웹 크롤러(GPTBot)를 차단할 수 있습니다 / You Can Now Block OpenAI’s Web Crawler (2 minute read)
이제 OpenAI의 웹 크롤러가 GPT 모델 학습에 도움이 되는 데이터를 사이트에서 스크래핑하지 못하도록 차단할 수 있습니다.
OpenAI now lets you block its web crawler from scraping your site for data to help train GPT models.