제품

인사이트

회사·지원

문의하기

빠른 견적내기

빠른 견적

문의하기

빠른 견적내기

CES 2026 젠슨 황 키노트 완벽 분석

Rubin 플랫폼, DGX Spark, 피지컬 AI까지 CES 2026을 정리했어요

엑스디노드 기술팀

2026. 1. 8.

읽는 시간 약

15분

2026년 1월 5일, 라스베이거스 폰테인블로 호텔. 세계 최대 가전·기술 박람회 CES의 무대에 NVIDIA의 창립자이자 CEO인 젠슨 황(Jensen Huang)이 등장했어요. 검은 가죽 재킷을 입은 그는 2시간이 넘는 키노트를 통해 AI 산업의 미래를 완전히 새롭게 정의했는데요. 이번 키노트의 핵심 메시지는 명확했어요. AI는 더 이상 클라우드 데이터센터에만 존재하는 기술이 아니라, 모든 산업, 모든 디바이스, 모든 책상 위로 확장된다는 거예요. 젠슨 황은 이를 실현하기 위한 구체적인 기술 청사진을 제시했고, 이는 전 세계 기업들의 AI 전략에 직접적인 영향을 미칠 것으로 예상돼요.

"컴퓨팅은 가속 컴퓨팅과 인공지능의 결과로 근본적으로 재편되었습니다. 이것이 의미하는 바는 지난 10년간 약 10조 달러 규모의 컴퓨팅 인프라가 이제 이 새로운 컴퓨팅 방식으로 현대화되고 있다는 것입니다." — Jensen Huang, NVIDIA CEO, CES 2026 키노트

핵심 수치 세 가지만 짚어볼게요. $10T는 재편되는 글로벌 컴퓨팅 인프라 규모, 1/10은 Rubin 플랫폼의 토큰 생성 비용, 5배는 Blackwell 대비 Rubin 성능 향상이에요.

Rubin 플랫폼은 왜 차세대 AI의 심장인가요?

젠슨 황은 이번 키노트에서 가장 먼저 NVIDIA Rubin 플랫폼을 공개했어요. 암흑 물질의 존재를 최초로 관측 증거로 입증한 미국의 천문학자 베라 루빈(Vera Rubin)의 이름을 딴 이 플랫폼은, Blackwell 아키텍처의 후속작이자 NVIDIA 역사상 최초의 극한 코디자인(Extreme Codesign) 6칩 AI 플랫폼이에요.

Rubin 플랫폼 핵심 구성요소

Rubin GPU — 50 페타플롭스의 NVFP4 추론 성능
Vera CPU — 데이터 이동 및 에이전틱 처리에 최적화
NVLink 6 — 스케일업 네트워킹 기술
Spectrum-X 이더넷 포토닉스 — 스케일아웃 네트워킹
ConnectX-9 SuperNIC — 차세대 네트워크 인터페이스
BlueField-4 DPU — AI 네이티브 스토리지 인프라 구현

극한 코디자인이라는 개념이 중요한 이유가 있어요. AI를 기가스케일(Gigascale)로 확장하려면 칩, 트레이, 랙, 네트워킹, 스토리지, 소프트웨어 전반에 걸친 긴밀하게 통합된 혁신이 필요하기 때문이에요. 개별 컴포넌트의 성능 향상만으로는 병목현상을 제거하고 학습 및 추론 비용을 극적으로 낮출 수 없거든요.

AI 토큰 비용의 혁명적 절감

Rubin 플랫폼의 가장 충격적인 발표는 AI 토큰 생성 비용을 이전 세대 대비 1/10로 낮춘다는 거예요. 이는 단순한 성능 향상을 넘어 AI의 경제성 자체를 재정의하는 변화에요. 대규모 AI 모델 배포가 훨씬 더 경제적으로 가능해지면서, 지금까지 비용 때문에 시도하지 못했던 수많은 AI 애플리케이션이 현실화될 거예요.

10배. 토큰 생성 비용 절감. Rubin 플랫폼은 동일한 AI 작업을 10분의 1 비용으로 수행해요. 또한 NVIDIA는 Inference Context Memory Storage Platform을 함께 발표했는데, BlueField-4 기반 AI 네이티브 KV 캐시 계층으로 긴 컨텍스트 추론에서 초당 토큰 처리량 5배, TCO 대비 성능 5배, 전력 효율 5배를 달성해요.

오픈 모델 생태계는 어떻게 구성되나요?

젠슨 황은 NVIDIA가 단순히 하드웨어 회사가 아닌 프론티어 AI 모델 빌더라고 선언했어요. 그리고 그 모델들을 완전히 오픈소스로 공개하여 모든 기업, 모든 산업, 모든 국가가 AI 혁명에 참여할 수 있도록 하고 있어요. NVIDIA의 오픈 모델 포트폴리오는 6개의 핵심 도메인을 포괄해요.

모델명	도메인	주요 기능
Clara	헬스케어	의료 영상 분석, 약물 발견, 유전체학
Earth-2	기후과학	기후 변화 예측, 날씨 시뮬레이션
Nemotron	추론/멀티모달	에이전틱 시스템 구축, 멀티 에이전트 AI
Cosmos	로보틱스	로보틱스 학습, 시뮬레이션, 물리 세계 이해
GR00T	체화된 지능	휴머노이드 로봇, 범용 로봇 정책 모델
Alpamayo	자율주행	추론 비전-언어-액션(VLA) 모델

Nemotron 3 — 에이전틱 AI의 핵심

특히 주목할 만한 건 Nemotron 3 패밀리예요. Nano, Super, Ultra 세 가지 크기로 제공되는 이 모델들은 혁신적인 하이브리드 레이턴트 MoE(Mixture-of-Experts) 아키텍처를 도입해서, 개발자들이 신뢰할 수 있는 멀티 에이전트 시스템을 대규모로 구축하고 배포할 수 있게 해요. 조직들이 단일 모델 챗봇에서 협업하는 멀티 에이전트 AI 시스템으로 전환하면서, 개발자들은 통신 오버헤드, 컨텍스트 드리프트, 높은 추론 비용이라는 과제에 직면하고 있거든요. Nemotron 3는 이러한 과제를 직접 해결해요.

물리 AI는 무엇이고 왜 중요한가요?

젠슨 황이 CES 2026에서 강조한 또 다른 핵심 주제는 물리 AI(Physical AI)예요. AI가 이제 디지털 세계를 넘어 물리적 세계에 뿌리내리고 있다는 거예요. 학습, 추론, 엣지 컴퓨팅을 위한 NVIDIA의 기술들이 이를 가능하게 해요. 물리 AI의 핵심은 시뮬레이션이에요. 이러한 시스템들은 실제 세계와 상호작용하기 훨씬 전에 가상 세계에서 합성 데이터로 학습될 수 있거든요. 젠슨 황은 비디오, 로보틱스 데이터, 시뮬레이션으로 학습된 NVIDIA Cosmos 오픈 월드 파운데이션 모델을 선보였어요.

Cosmos 월드 파운데이션 모델의 역할

단일 이미지에서 사실적인 비디오 생성 — 하나의 이미지를 입력하면 물리적으로 사실적인 비디오 시퀀스를 생성
멀티카메라 주행 시나리오 합성 — 자율주행 학습을 위한 다양한 시나리오 자동 생성
엣지케이스 환경 모델링 — 시나리오 프롬프트에서 드문 상황의 환경 생성
물리적 추론 및 궤적 예측 — 물리 법칙을 이해하고 물체의 움직임 예측
인터랙티브 클로즈드루프 시뮬레이션 — 실시간 상호작용이 가능한 시뮬레이션 구동

Alpamayo — 자율주행의 새로운 지평

젠슨 황은 Alpamayo를 공개했어요. 이는 추론 비전-언어-액션(VLA) 모델, 시뮬레이션 블루프린트, 데이터셋으로 구성된 오픈 포트폴리오로, 레벨 4 자율주행을 가능하게 해요. 특히 Alpamayo R1은 자율주행을 위한 최초의 오픈 추론 VLA 모델이에요. 무대에서는 Alpamayo가 탑재된 차량이 복잡한 샌프란시스코 교통 상황을 부드럽게 탐색하는 영상이 공개됐어요. 그리고 이 기술이 적용된 첫 번째 양산차가 곧 도로 위에 등장하는데요. NVIDIA DRIVE 풀스택 자율주행 플랫폼을 기반으로 한 신형 Mercedes-Benz CLA가 바로 그거예요.

"센서 입력을 받아 스티어링 휠, 브레이크, 가속을 작동시킬 뿐만 아니라, 어떤 행동을 취하려는지에 대해 추론합니다." — Jensen Huang, Alpamayo 시연 중

에이전틱 AI는 어떻게 기업 업무를 바꿀까요?

CES 2026 키노트의 또 다른 핵심 키워드는 에이전틱 AI(Agentic AI)예요. 에이전틱 AI란 단순히 질문에 답하는 것을 넘어, 스스로 추론하고, 계획을 세우고, 실제로 행동을 수행하는 AI 시스템을 의미해요. 젠슨 황은 Palantir, ServiceNow, Snowflake, CrowdStrike, NetApp 등 세계 선도 기업들이 NVIDIA AI를 통합해 자사 제품을 강화하고 있다고 소개했어요. 그리고 이러한 기업들의 핵심 인터페이스가 바로 에이전틱 시스템이라고 강조했죠.

AI 발전 단계의 진화

1단계: 생성형 AI (Generative AI). 단일 프롬프트에 대응하여 텍스트, 이미지, 코드를 생성하는 AI로, ChatGPT로 대표되는 현재 주류 AI 형태예요.

2단계: 에이전틱 AI (Agentic AI). 복잡한 멀티스텝 문제를 정교한 추론과 계획을 통해 해결해요. 도구를 사용하고, 외부 시스템과 상호작용하며, 자율적으로 작업을 완료하죠.

3단계: 물리 AI (Physical AI). 디지털 세계를 넘어 로봇, 자율주행차 등 물리적 세계에서 행동하는 AI로, 현실 세계의 물리 법칙을 이해하고 적용해요.

에이전틱 AI가 중요한 이유는 기업 업무의 본질적 변화 때문이에요. 단순한 질의응답이 아닌, 복잡한 워크플로우를 자동화하고, 여러 단계에 걸친 의사결정을 수행하며, 다양한 시스템과 상호작용하면서 실제 업무를 처리할 수 있는 AI가 필요해졌어요. NVIDIA는 이를 위해 NIM 마이크로서비스, NeMo, 그리고 다양한 AI 블루프린트를 제공해요. CrewAI, LangChain, LlamaIndex 등 주요 에이전틱 AI 오케스트레이션 툴 제공업체들과 협력해 기업들이 빠르게 에이전틱 AI 애플리케이션을 구축할 수 있는 환경을 조성하고 있죠.

"Every Desk" AI는 무슨 뜻인가요?

젠슨 황은 AI의 미래가 슈퍼컴퓨터 데이터센터에만 있지 않다고 강조했어요. AI는 개인적인 것이 될 것이라는 거예요. 이 비전의 핵심에 DGX Spark와 DGX Station이 있어요. CES 2026 무대에서 젠슨 황은 인상적인 데모를 선보였는데요. DGX Spark 데스크톱 슈퍼컴퓨터에서 로컬로 실행되는 개인화된 AI 에이전트가 Hugging Face의 Reachy Mini 로봇을 통해 물리적으로 구현되는 모습이었어요. 오픈 모델, 모델 라우팅, 로컬 실행을 활용해 에이전트가 반응하는 물리적 협력자로 변신하는 거예요.

"놀라운 것은 이것이 지금은 완전히 사소한 일이 되었지만, 불과 몇 년 전만 해도 불가능했을 것이고, 상상조차 할 수 없었을 것이라는 점입니다." — Jensen Huang, DGX Spark 데모 중

왜 "Every Desk"인가요?

클라우드 기반 AI는 강력하지만 한계가 있어요. 데이터 프라이버시 우려, 네트워크 지연 시간, 지속적인 구독 비용, 민감한 데이터의 외부 전송 문제 등이 그거예요. 특히 기업 환경에서는 지적 재산권 보호, 규정 준수, 실시간 응답 요구사항 때문에 로컬 AI 인프라에 대한 수요가 급증하고 있어요.

데이터 보안 — 민감한 기업 데이터가 외부로 나가지 않고 로컬에서 처리돼요
지연 시간 최소화 — 네트워크 왕복 없이 즉각적인 AI 응답이 가능해요
비용 예측 가능성 — 토큰당 과금이 아닌 하드웨어 일회성 투자로 비용 통제가 가능해요
맞춤화 자유도 — 오픈 모델을 자유롭게 파인튜닝하고 커스터마이징할 수 있어요
오프라인 가용성 — 인터넷 연결 없이도 AI 기능을 완전히 사용할 수 있어요

DGX Spark와 DGX Station의 차이는 무엇인가요?

NVIDIA DGX Spark는 NVIDIA Grace Blackwell 아키텍처로 구동되며, 대용량 통합 메모리와 페타플롭급 AI 성능을 제공해요. 개발자들이 로컬에서 개발하고 클라우드로 쉽게 확장할 수 있는 새로운 기능을 제공하죠.

DGX Spark 핵심 사양

지원 모델 규모 최대 1000억 파라미터, 아키텍처 Grace Blackwell, 성능 향상 대형 모델 2.6배, 데이터 포맷 NVFP4 지원(최대 70% 모델 압축), 소프트웨어 NVIDIA AI 소프트웨어 및 CUDA-X 라이브러리 사전 구성이에요.

CES 2026에서 발표된 DGX Spark 주요 업데이트

CES 2026에서 NVIDIA는 DGX Spark가 대형 모델에서 최대 2.6배의 성능 향상을 달성했다고 발표했어요. Lightricks LTX-2, FLUX 이미지 모델에 대한 새로운 지원과 함께, NVIDIA AI Enterprise의 출시가 예정되어 있고요. DGX Spark에서 실행 가능한 최신 AI 모델은 NVIDIA Nemotron 3 Nano, Llama 3.3 Nemotron Super 49B, Black Forest Labs FLUX.1/FLUX.2, Alibaba Qwen-Image, Lightricks LTX-2, NVIDIA Nsight 기반 로컬 CUDA 코딩 어시스턴트, OpenRAG on Spark 등이 있어요.

DGX Station — 1조 파라미터 모델을 책상 위에서

더 강력한 성능이 필요하다면 DGX Station이 답이에요. GB300 Grace Blackwell Ultra 수퍼칩과 775GB의 코히런트 메모리(FP4 정밀도)를 탑재해, 최대 1조 파라미터 모델을 데스크톱에서 실행할 수 있어요.

항목	DGX Spark	DGX Station
지원 모델 규모	최대 1000억 파라미터	최대 1조 파라미터
아키텍처	Grace Blackwell	GB300 Grace Blackwell Ultra
메모리	대용량 통합 메모리	775GB 코히런트 메모리
타겟 사용자	개발자, 연구자, 데이터 과학자	프론티어 AI 연구소, 대기업
출시 시기	현재 구매 가능	2026년 봄 예정

DGX Station에서는 Kimi-K2 Thinking, DeepSeek-V3.2, Mistral Large 3, Meta Llama 4 Maverick, Qwen3, OpenAI gpt-oss-120b 등 가장 진보된 AI 모델들을 실행할 수 있어요.

Reachy Mini — AI 에이전트의 물리적 구현

CES 2026에서 가장 인상적인 데모 중 하나는 DGX Spark와 Reachy Mini 로봇의 결합이었어요. Hugging Face와 Pollen Robotics가 공동 개발한 이 오픈소스 로봇은 DGX Spark의 AI 능력을 물리적 세계로 확장해요.

"오픈 모델은 개발자에게 자신만의 방식으로 AI를 구축할 자유를 주고, DGX Spark는 그 힘을 데스크톱으로 직접 가져옵니다. Reachy Mini에 연결하면 로컬 AI 에이전트가 체화되어 자신만의 목소리를 얻습니다. 그들은 여러분을 보고, 듣고, 표현적인 동작으로 응답할 수 있습니다." — Jeff Boudier, VP of Product, Hugging Face

산업 전반의 채택과 파트너십은 어떤가요?

DGX Spark와 DGX Station은 이미 다양한 산업에서 채택되고 있어요. 소프트웨어 리더, 오픈소스 혁신가, 글로벌 워크스테이션 파트너들이 로컬 추론, 에이전틱 워크플로우, RAG를 중앙 집중식 인프라의 복잡성 없이 구현하기 위해 DGX Spark를 도입하고 있어요.

글로벌 리더들의 평가

IBM Ed Anuff (VP of Data and AI Platform Strategy)는 "DGX Spark는 AI 추론을 엣지로 가져옵니다. OpenRAG on Spark를 통해 사용자는 완전한 자체 포함 RAG 스택을 박스 형태로 얻습니다"라고 평가했어요. JetBrains Kirill Skrygan (CEO)는 "보안, 거버넌스, 지적 재산에 대한 완전한 통제가 필요한 조직들을 위해, NVIDIA DGX Spark는 JetBrains 고객에게 페타플롭급 AI 성능을 제공합니다"라고 언급했고요. vLLM Kaichao You (Core Maintainer)는 "DGX Station은 이 역학을 바꿉니다. 컴팩트한 단일 시스템 폼팩터로 GB300을 데스크톱에 제공함으로써, vLLM이 GB300 특화 기능을 훨씬 낮은 비용으로 테스트하고 개발할 수 있게 합니다"라고 평가했어요.

DGX Spark 구매처

DGX Spark와 제조사 파트너 GB10 시스템은 현재 다음 파트너사에서 구매할 수 있어요.

Acer — Veriton GN100 AI Mini Workstation
Amazon — NVIDIA DGX Spark 직접 판매
ASUS — Ascent GX10
Dell Technologies — Dell Pro Max NVIDIA AI Dev
GIGABYTE — AI TOP ATOM
HP Inc. — ZGX Nano AI Station
Lenovo — ThinkStation PGX SFF
MSI — Next Level AI Power 시리즈
PNY — DGX Spark

DGX Station은 2026년 봄부터 ASUS, Boxx, Dell Technologies, GIGABYTE, HP Inc., MSI, Supermicro에서 출시될 예정이에요.

정리하자면

CES 2026에서 젠슨 황이 제시한 비전은 명확해요. AI는 클라우드에서 엣지로, 데이터센터에서 데스크톱으로, 범용에서 개인화로 진화하고 있어요. 이 변화는 기업들에게 AI 인프라 전략의 근본적인 재검토를 요구해요.

B2B 기업을 위한 핵심 시사점

첫째, 하이브리드 AI 전략 수립. 클라우드 AI와 로컬 AI를 적절히 조합한 하이브리드 전략이 필수예요. 민감한 데이터는 로컬에서, 대규모 학습은 클라우드에서 처리하는 유연한 접근이 필요해요.

둘째, 에이전틱 AI 도입 준비. 단순한 챗봇을 넘어 실제 업무를 자동화하는 에이전틱 AI 시스템 도입을 검토해야 해요. NVIDIA의 NIM, NeMo, AI 블루프린트가 출발점이 될 수 있어요.

셋째, 물리 AI 활용 기회 탐색. 제조, 물류, 자율주행 등 물리적 세계와 상호작용하는 분야에서 물리 AI의 활용 가능성을 검토해야 해요.

넷째, 인프라 현대화 가속. 10조 달러 규모의 컴퓨팅 인프라 재편에 뒤처지지 않으려면 가속 컴퓨팅으로의 전환을 서둘러야 해요.

젠슨 황의 말처럼, "AI 모델을 더 빠르게 학습시킬수록, 다음 프론티어를 더 빨리 세상에 내놓을 수 있습니다." 이는 곧 기술 리더십이자 시장 선점 기회예요. DGX Spark와 DGX Station은 이 경쟁에서 앞서나갈 수 있는 구체적인 도구를 제공해요.

Newsletter

AI 인프라 인사이트, 메일로 받아보세요

GPU 시세 동향, 신제품 출시, 인프라 구축 기술 가이드를 월 2회 정리해 보내드립니다.

엑스디노드를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.

빠른 견적 확인하기

→

엑스디노드를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.

빠른 견적 확인하기

→

엑스디노드를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.

빠른 견적 확인하기

→

제품

인사이트

회사·지원

GPU Server

GPU Workstation

GPU

DGX Platform

백서

상품 가이드

솔루션

리포트

뉴스룸

회사 소개

고객 지원

개인정보처리방침

서비스 이용약관

마케팅 정보 수집 및 활용 동의

(주)엑스디노드

전화번호: 02-6671-9000

주소: 서울시 성동구 성수일로 89 메타모르포 501, 505호

통신판매 신고번호: 2024-서울송파-3420

사업자등록번호 : 393-86-02729

제품

GPU Server

GPU Workstation

GPU

DGX Platform

인사이트

백서

상품 가이드

솔루션

리포트

뉴스룸

회사·지원

회사 소개

고객 지원

개인정보처리방침

서비스 이용약관

마케팅 정보 수집 및 활용 동의

(주)엑스디노드

전화번호: 02-6671-9000

주소: 서울시 성동구 성수일로 89 메타모르포 501, 505호

통신판매 신고번호: 2024-서울송파-3420

사업자등록번호 : 393-86-02729

제품

GPU Server

GPU Workstation

GPU

DGX Platform

인사이트

백서

상품 가이드

솔루션

리포트

뉴스룸

회사·지원

회사 소개

고객 지원

개인정보처리방침

서비스 이용약관

마케팅 정보 수집 및 활용 동의

(주)엑스디노드

전화번호: 02-6671-9000

주소: 서울시 성동구 성수일로 89 메타모르포 501, 505호

통신판매 신고번호: 2024-서울송파-3420

사업자등록번호 : 393-86-02729

AI 연구 인프라, 어디서부터 설계해야 할까요?

리포트로 확인하기

호환성 확인하기

AI 연구 인프라,

어디서부터 설계해야 할까요?

빠른 견적

AI 연구 인프라, 어디서부터 설계해야 할까요?

리포트로 확인하기

호환성 확인하기

CES 2026 젠슨 황 키노트 완벽 분석

Rubin 플랫폼, DGX Spark, 피지컬 AI까지 CES 2026을 정리했어요