Microsoft Build 2026, 온디바이스 AI와 에이전트 플랫폼으로 진화하는 Windows (feat. MXC)

9bow · 6월 3, 2026, 6:30오후

Microsoft Build 2026 소개

Microsoft Build는 매년 마이크로소프트가 개발자 생태계에 한 해 동안의 방향성을 공개하는 자리입니다. 2026년 Build 개발자 블로그 발표의 핵심 메시지는 분명합니다. Windows를 "개발을 위한 신뢰할 수 있는 플랫폼(trusted platform for development)"으로 만든다 는 것입니다. 여기서 신뢰란 단순히 안정성만을 뜻하지 않습니다. 로컬과 클라우드를 넘나들며, 언어와 프레임워크에 구애받지 않고, 무엇보다 AI 에이전트를 안전하게 빌드하고 실행할 수 있는 운영체제 라는 의미를 담고 있습니다.

이번 발표가 PyTorchKR 커뮤니티에 특히 흥미로운 이유는, 발표의 무게 중심이 일반적인 생산성 기능이 아니라 온디바이스 AI 와 에이전트 실행 보안 에 쏠려 있기 때문입니다. AI 모델이 강력해질수록 에이전트 워크플로우는 끊임없는 연산을 요구하고, 그만큼 클라우드 비용도 가파르게 오릅니다. 마이크로소프트는 이 문제를 "일부 지능을 엣지로 옮긴다(shifting some of that intelligence to the edge)" 는 전략으로 풀려고 합니다. 프론티어 모델은 프론티어 문제를 처리하고, 나머지는 로컬에서 대규모로 실행한다는 구상입니다.

동시에 에이전트가 자율적으로 코드를 실행하고 파일과 네트워크에 접근하기 시작하면서, 운영체제 차원의 격리(containment), 신원(identity), 관리성(manageability) 이 새로운 1차 관심사로 떠올랐습니다. 이 글에서는 Build 2026에서 공개된 내용 중 AI/ML 개발자에게 직접적으로 의미 있는 발표들을 골라, 개발 경험, 에이전트 보안, 온디바이스 AI, 하드웨어의 네 축으로 나누어 정리합니다.

한눈에 보는 핵심 발표

개발자 최적화 Windows 11: Coreutils for Windows 정식 출시, WSL 컨테이너 공개 예고, 컨텍스트 인식형 Intelligent Terminal, 한 줄 명령으로 끝나는 개발 환경 구성
에이전트 실행 보안: 정책 기반 실행 계층인 Microsoft Execution Containers(MXC) 얼리 프리뷰, OS가 강제하는 에이전트 신원과 Agent 365 통합
온디바이스 AI: 새로운 소규모 언어 모델 Aion 1.0 Instruct 와 추론, 도구 호출이 가능한 Aion 1.0 Plan, CPU와 GPU로 확장되는 Windows AI API, 신규 음성 인식 API
개발자용 AI 하드웨어: NVIDIA RTX Spark 기반 Surface RTX Spark Dev Box와, 최대 1조 파라미터 모델을 로컬에서 돌리는 DGX Station for Windows
하이브리드 컴퓨트: GitHub Copilot CLI의 /fleet로 클라우드 주 에이전트가 작업 복잡도에 따라 일부를 로컬 모델에 위임

개발자에 최적화된 Windows 11 개발 경험

마이크로소프트는 먼저 개발자가 매일 마주하는 기본기를 다듬었습니다. 자주 쓰는 명령줄 유틸리티, 익숙한 셸 환경, 빠른 셋업, 그리고 Windows에서 리눅스 컨테이너를 다루는 내장 경로를 한꺼번에 제공합니다.

Linux 명령어가 그대로 동작하는 Coreutils for Windows

개발자는 플랫폼 사이를 끊임없이 오가지만, 익숙한 명령어가 환경마다 다르게 동작해 우회 방법을 찾느라 속도와 맥락을 잃곤 합니다. Coreutils for Windows는 이 문제를 정면으로 겨냥합니다. GNU Coreutils를 Rust로 재구현한 오픈소스 프로젝트 uutils를 기반으로, 리눅스 스타일의 명령줄 유틸리티가 Windows에서 네이티브로 실행됩니다. 이번 Build에서 정식 출시(generally available) 되었습니다.

AI/ML 워크플로우를 위한 WSL 컨테이너

컨테이너와 리눅스는 현대 개발 워크플로우의 핵심입니다. Windows Subsystem for Linux(WSL)은 이미 Windows에서 리눅스 워크로드를 돌리는 토대가 되었고, 2025년 오픈소스로 전환된 이후 월 200건이 넘는 PR이 쌓일 만큼 커뮤니티 기여가 활발합니다. 마이크로소프트는 여기에 WSL 컨테이너 를 더해 WSL을 Windows에 더 깊이 통합합니다.

기존에는 Windows에서 컨테이너를 다루려면 서드파티 도구에 의존해 셋업 부담, 라이선스 비용, 제한된 엔터프라이즈 통제를 감수해야 했습니다. WSL 컨테이너는 리눅스 컨테이너를 생성, 실행, 제어하는 내장 경로를 제공하며, 새로운 CLI와 API를 함께 제공합니다. 특히 API는 네이티브 Windows 앱에서 리눅스 컨테이너를 프로그래밍 방식으로 실행할 수 있게 해, 로컬 AI 워크로드 실행, 테스트 파이프라인, 리눅스 기반 처리 같은 시나리오를 열어줍니다. WSL 컨테이너는 향후 몇 달 안에 퍼블릭 프리뷰로 제공될 예정입니다.

터미널 안에서 에이전트를 부르는 Intelligent Terminal

개발자는 작업 시간의 상당 부분을 터미널에서 보내지만, 오늘날의 터미널은 에이전트 도구나 맥락과 잘 통합되어 있지 않습니다. Intelligent Terminal 은 ACP(Agent Communication Protocol)를 통해 즐겨 쓰는 에이전트에 컨텍스트를 전달하여, 터미널을 떠나지 않고도 질문하고 디버깅하며 작업을 완료할 수 있게 합니다. 기존 Windows Terminal 경험(탭, 프로파일, 테마, 셸) 위에 에이전트 CLI 통합을 더한 형태이며, 명령이 실패하면 자동으로 맥락을 끌어와 바로 실행 가능한 수정안을 제안합니다. 현재 실험 버전으로 제공되며, 자세한 내용은 Intelligent Terminal 출시 블로그에서 확인할 수 있습니다.

에이전트를 위한 구조화된 지식, Windows Development Skills

Windows Development Skills 는 에이전트가 WinUI3 스킬과 winapp CLI를 활용해 네이티브 Windows 앱을 처음부터 끝까지 만들 수 있도록 구조화된 지식을 제공합니다. 에이전트에 Windows 특화 개발 지식을 주입함으로써 토큰 효율을 높이는 것이 핵심입니다. 이와 함께 Windows Developer Configurations는 WinGet 기반으로 VS Code, PowerShell 7, WSL, Git 등을 한 번의 명령으로 설치해 새 머신을 몇 분 만에 코딩 가능한 상태로 만들어 줍니다. 같은 구성은 클라우드 기반 Windows 365에도 사전 탑재되어 퍼블릭 프리뷰로 제공됩니다.

에이전트를 안전하게 실행하는 운영체제

에이전트가 더 유능하고 자율적으로 변하면서 실질적인 생산성 향상을 가져오고 있지만, 동시에 새로운 위험도 함께 들어옵니다. 마이크로소프트는 이를 "에이전트 하나의 문제가 아니라, 에이전트가 동작하는 시스템 전체의 문제(a multi-layer systems problem)" 라고 진단합니다. 에이전트와 사람, 도구, 앱, 모델, 그리고 다른 에이전트 사이의 모든 상호작용이 새로운 공격 표면을 만들어내기 때문입니다.

정책 기반 실행 계층, Microsoft Execution Containers(MXC)

Microsoft Execution Containers(MXC)는 Windows와 WSL을 아우르는 크로스 플랫폼 정책 기반 실행 계층 입니다. 개발자가 에이전트가 접근할 수 있는 대상(파일, 네트워크 등)을 선언하면, MXC가 런타임에 그 경계를 강제합니다. 핵심은 단일 SDK와 정책 모델로 워크로드에 맞는 격리 수준을 골라 쓸 수 있는 구성 가능한 샌드박스 스펙트럼(composable sandbox spectrum) 이라는 점입니다.

프로세스 격리(process isolation): 에이전트 실행을 사용자 데스크톱, 클립보드, UI, 입력 장치로부터 분리합니다. 이미 GitHub Copilot CLI가 채택했으며, UI 스푸핑과 입력 인젝션, 세션 간 데이터 유출을 완화합니다.
세션 격리(session isolation): 에이전트를 강력한 사용자 신원에 결속시켜 활동을 추적 가능하게 만듭니다.
Windows 365 for Agents: 격리를 로컬 장치 너머로 확장해, 에이전트가 Intune으로 관리되는 Cloud PC에서 사용자 머신과 완전히 분리된 채 실행됩니다.
로드맵: 마이크로 VM, 리눅스 컨테이너, Windows 365 for Agents용 MXC 통합이 추가 격리 수단으로 예정되어 있습니다.

OS가 강제하는 에이전트 신원과 관리성

격리를 넘어, 모든 에이전트 활동은 귀속 가능하고 통제 가능해야 합니다. Windows는 에이전트에 로컬 ID 또는 Microsoft Entra 기반의 클라우드 신원을 부여하고, 컨테이너에서 발생하는 모든 활동을 그 신원에 귀속시킵니다. 사람과 에이전트를 명확히 구분 할 수 있게 되는 셈입니다. 여기에 Agent 365가 Defender, Entra, Intune, Purview 보호를 얹어, 접근 권한과 민감 데이터, 악성 프롬프트, 위험 행동에 대한 런타임 보호를 제공합니다.

생태계 파트너와 함께 만드는 격리

마이크로소프트는 MXC가 실제 개발자의 필요를 충족하도록 Hermes, Manus, NVIDIA, OpenAI, OpenClaw 등 업계 파트너와 협력하고 있습니다. 특히 Nous Research의 자기 개선형 에이전트인 Hermes Agent 는 NVIDIA의 OpenShell과 MXC를 자사 Windows 애플리케이션에 통합할 예정입니다.

"Hermes Agent처럼 상시 실행되는 로컬 에이전트는 의도적인 격리를 필요로 합니다. 개발자는 에이전트가 무엇에 접근할 수 있는지 통제하고, 그 통제가 유지된다고 신뢰할 수 있어야 합니다. MXC는 OpenShell과 통합되어 Windows에서 프라이빗한 온디바이스 에이전트를 위한 정책 기반 토대를 제공합니다." — Dillon Rolnick, Nous Research CEO

OpenAI Codex는 MXC를 통해 AI 에이전트가 안전하고 효율적으로 코드를 생성하고 실행하는 새로운 패턴을 탐색하고 있으며, Manus 역시 MXC의 런타임 경계 강제를 통해 더 자율적인 에이전트를 엔터프라이즈 환경에서 안전하게 운영하는 방안을 모색합니다. 또한 Windows 365 for Agents가 Agent 365 안에서 정식 출시되어, 앱을 열고 인터페이스를 탐색하며 데이터를 처리하는 컴퓨터 사용 에이전트(computer-using agent)를 구축할 수 있게 되었습니다.

측정되지 않는 지능: 온디바이스 AI

에이전트 워크플로우가 지속적인 연산을 요구하면서 클라우드 비용이 누적되는 지금, 마이크로소프트는 일부 지능을 엣지로 옮겨 "프론티어 모델은 프론티어 문제를, 그 외에는 모두 로컬에서 대규모로(frontier models tackle frontier problems, while everything else runs locally at scale)" 처리하는 방향을 제시합니다. 이 비전의 플랫폼이 바로 Windows ML입니다.

로컬 실행을 위한 차세대 모델, Aion 1.0

마이크로소프트는 로컬 실행에 특화된 새로운 세대의 소규모 언어 모델(SLM)을 공개했습니다. 두 모델은 효율에서 로컬 에이전트 추론으로 이어지는 명확한 단계를 이룹니다.

Aion 1.0 Instruct: 기존 Windows OS SLM보다 작고 빠르며 효율적인 차세대 모델로, 요약, 재작성, 의도 파악, 접근성 같은 일상적 텍스트 지능을 담당합니다. Edge Insider 채널에서 프리뷰로 실험할 수 있으며, 7월에는 Hugging Face에 오픈 웨이트로 공개될 예정입니다.
Aion 1.0 Plan: 32K 컨텍스트 길이를 가진 140억(14B) 파라미터 의 추론 및 도구 호출 모델로, 일부 고성능 장치의 Windows에 인박스(in-box)로 탑재됩니다. 사용자 의도를 추론하고 도구를 호출하며 파일을 관리하고 하위 에이전트를 오케스트레이션하여, 완전한 에이전트 워크플로우를 장치 위로 가져옵니다.

오픈 웨이트로 공개되는 Aion 1.0 Instruct는 apples2oranges 같은 온디바이스 SLM 벤치마킹 도구나 Needle처럼 로컬 함수 호출에 특화된 소형 모델 흐름과 맞닿아 있어, 로컬 추론에 관심 있는 개발자라면 직접 비교 실험을 해볼 만합니다.

CPU와 GPU로 확장되는 Windows AI API와 음성 인식

Windows AI API는 온디바이스 모델을 즉시 쓸 수 있는 API로 제공해 로컬 AI를 앱에 통합하는 가장 빠른 경로를 제시합니다. 이번 발표로 이 API들이 NPU를 넘어 CPU와 GPU로 확장 됩니다. 기존 Windows 인박스 SLM(Phi Silica)이 고성능 GPU에서 동작하고, Video Super Resolution과 음성 인식이 CPU에서 실행되어 훨씬 넓은 범위의 Windows 11 장치에 로컬 AI 경험을 가져옵니다.

새롭게 추가된 음성 인식 API(Speech Recognition API) 는 실시간 또는 배치 방식의 온디바이스 음성-텍스트 변환을 지원합니다. 마이크, 스트리밍, 오디오 파일을 입력으로 받아 가능한 경우 하드웨어 가속으로 실행되며, 로컬에서 동작하므로 네트워크 연결 없이도 전사(transcription)를 생성하고 클라우드 비용을 절감할 수 있습니다. 초기에는 영어에 한정되며 점진적으로 확대될 예정입니다. 한 가지 인상적인 설계는, AI API를 구동하는 인박스 모델이 모든 장치에 자동으로 내려받아지지 않고 앱이 요청할 때만 획득 되어 저장 공간과 대역폭 부담을 최소화한다는 점입니다.

많은 앱 개발자가 Microsoft Foundry on Windows를 활용해 로컬 AI를 자사 애플리케이션에 통합하고 있습니다. 효율적인 소형 모델부터 에이전트 추론, 프론티어 코딩까지 아우르는 이 흐름이 마이크로소프트가 말하는 "측정되지 않는 지능(unmetered intelligence)" 의 실체입니다.

하이브리드 컴퓨트와 개발자용 AI 하드웨어

로컬에서 돌아가는 에이전트와 코딩 모델의 역량이 커지면서, 마이크로소프트는 클라우드와 클라이언트의 장점을 결합하는 하이브리드 컴퓨트 로 한 걸음 더 나아갑니다. GitHub Copilot CLI에서는 /fleet 기능을 통해 클라우드에서 실행되는 주 에이전트가 계획을 세우고 각 작업의 복잡도를 평가한 뒤, 적절한 작업을 로컬 모델로 라우팅합니다. 가용한 로컬 연산을 활용해 품질을 해치지 않으면서 비용을 줄이는 접근입니다. 이는 Gemma 4와 Pi Coding Agent로 완전히 로컬에서 실행하는 코딩 에이전트 같은 커뮤니티의 로컬 코딩 에이전트 실험과도 맥을 같이 합니다.

Surface RTX Spark Dev Box

Surface RTX Spark Dev Box 는 새로운 NVIDIA RTX Spark 실리콘으로 GPU 우선 AI 성능을 제공합니다. 1 페타플롭(petaflop) 의 AI 연산과, CPU와 GPU가 단일 메모리 주소 공간에서 동적으로 공유하는 128GB 통합 메모리 를 갖춰 모델 최적화, 파인튜닝, 대규모 추론 워크로드를 겨냥합니다. 이런 워크로드를 로컬에서 실용적으로 돌릴 수 있게 함으로써 클라우드 전용 워크플로우 의존도와 반복되는 토큰 비용을 줄여줍니다. 올해 말 미국에서 출시 예정이며 microsoft.com/devbox에서 더 알아볼 수 있습니다.

DGX Station for Windows

DGX Station for Windows 는 NVIDIA DGX Station 시스템 설계를 기반으로, NVIDIA GB300 Grace Blackwell급 AI 인프라를 Windows 생태계로 직접 가져오는 데스크사이드 AI 슈퍼컴퓨터입니다. 최대 1조(1 trillion) 파라미터 의 프론티어 AI 모델을 로컬에서 실행할 수 있어, 강력한 AI 에이전트를 빌드하고 실행하며 기존 Windows 애플리케이션과 인프라에 연결하는 데 필요한 연산을 제공합니다. 올해 4분기에 출시될 예정입니다.

이 외에도 AMD Ryzen AI MAX+ 395 같은 워크스테이션급 머신을 포함해, AMD, Intel, NVIDIA, Qualcomm의 다양한 실리콘에서 일상적 개발부터 프론티어급 작업까지 계층화된 로컬 AI 역량을 쓸 수 있게 됩니다.

기본값으로 강화되는 보안

Windows는 기본값으로 위험을 줄이는(reducing risk by default) 방향으로 보안 토대를 강화합니다. 특히 양자 컴퓨팅 시대를 대비해 양자 내성 암호(Post-Quantum Cryptography) 지원을 TLS 스택과 인증서 발급으로 확대하고, NTLM 의존도를 낮추는 강력한 Kerberos 기반 인증으로 전환하며, 신뢰할 수 있는 드라이버만 기본 실행되도록 서명 기준을 높입니다. 에이전트가 코드를 자동 생성하고 실행하는 시대에, 플랫폼 차원에서 코드 실행 이전 단계부터 보호를 강화한다는 점이 인상적입니다.

시사점: 로컬 AI 개발자에게 무엇을 의미하는가

Build 2026의 발표를 관통하는 흐름은 두 가지입니다. 하나는 추론을 엣지로 분산 하는 것이고, 다른 하나는 그렇게 자율화된 에이전트를 운영체제 차원에서 통제 하는 것입니다. 오픈 웨이트로 공개되는 Aion 1.0 Instruct, CPU와 GPU로 확대되는 Windows AI API, 그리고 1 페타플롭급 로컬 하드웨어는 "로컬에서 모델을 돌린다"는 선택지를 실험 단계에서 실무 단계로 끌어올립니다. 동시에 MXC와 에이전트 신원 체계는, 코드를 직접 실행하는 에이전트를 운영체제가 어떻게 가둘 것인가라는 질문에 대한 마이크로소프트의 구체적인 답변입니다.

물론 이번 발표의 상당 부분은 프리뷰이거나 향후 출시 예정 상태이며, 실제 성능과 가용성은 정식 공개 시점에 검증이 필요합니다. 그럼에도 PyTorch와 같은 프레임워크로 로컬 추론, 파인튜닝, 에이전트를 다루는 개발자라면, 온디바이스 SLM의 오픈 웨이트 공개와 정책 기반 에이전트 격리라는 두 갈래가 앞으로의 로컬 AI 개발 환경을 어떻게 바꿀지 지켜볼 만합니다.

Build 2026 발표 소개 블로그

Microsoft Execution Containers(MXC) GitHub 저장소

더 읽어보기

이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.

파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~