2026 GTC 타이베이 키노트 정리 — 엔비디아가 그린 AI 에이전트의 방향

GTC 타이베이 키노트와 젠슨 황 방한을 'AI 에이전트' 흐름으로 정리했어요

엑스디노드 마케팅팀

읽는 시간 약

9분

2026년 6월 1일, 타이베이 뮤직센터 무대에 선 젠슨 황은 블랙웰과 베라 루빈의 누적 주문이 이미 5,000억 달러를 넘었고, 2027년이면 1조 달러에 이를 거라고 말했어요. 객석이 술렁였죠.

그리고 나흘 뒤, 같은 사람이 서울 홍대의 한 PC방에 앉아 있었어요. 프로게이머 페이커 옆에서 신제품을 만지작거리면서요. 며칠 사이 무대와 거리를 오간 이 동선이, 사실은 한 가지 이야기를 하고 있었어요.

엔비디아가 지금 어디로 가고 있는가. 이번 GTC 타이베이 키노트에서 공개된 두 개의 칩과 젠슨 황의 방한 일정을 AI 에이전트라는 한 단어로 꿰어보면, 그림이 의외로 또렷하게 보여요. 함께 살펴볼게요.



생성에서 에이전트로, 키노트가 던진 한 문장

이번 키노트의 주제를 한 줄로 줄이면 이거예요. AI가 무언가를 '생성'해주는 단계에서, 스스로 계획하고 도구를 써서 일을 '실행'하는 에이전트 단계로 넘어갔다는 것. 젠슨 황은 이 변화를 키노트 내내 반복해서 강조했어요.

그 근거로 그는 흥미로운 숫자를 들었어요. 전 세계 소프트웨어 개발자 약 3,000만~4,000만 명의 연봉을 합치면 3조 달러 규모인데, AI 코딩 도구가 들어오면서 같은 인력이 약 3배의 결과물을 내고 있다는 거예요. 깃허브 커밋 수가 2023년 3억 건에서 2026년 15억 건으로 늘어난 것을 그 증거로 제시했죠. 이 내용은 NVIDIA 공식 블로그의 키노트 정리에서도 확인할 수 있어요.

그래서 그는 일자리가 줄어든다는 우려를 정면으로 반박했어요. 오히려 더 많은 엔지니어가 필요해진다고요. 에이전트가 늘어날수록 그 에이전트를 돌릴 연산 수요도 폭발적으로 커지니까요.

이제 연산이 곧 수익이에요. 1기가와트 전력을 가진 데이터센터라면, 와트당 처리량이 곧 매출이 되죠.

— 젠슨 황, GTC 타이베이 키노트

여기서 한 가지 비유를 빌려볼게요. 추론 서버를 식당이라고 하면, 토큰은 손님이고 처리량은 한 시간에 받는 손님 수예요. 같은 전력(같은 가게 크기)으로 손님을 더 많이 받을수록 매출이 올라가는 구조죠. 엔비디아가 칩과 랙을 한 몸으로 설계하는 이유가 바로 여기 있어요. 토큰당 비용을 최대한 낮춰야 하거든요.

그 결과물이 풀 프로덕션에 들어간 베라 루빈(Vera Rubin) 플랫폼이에요. 그런데 이 플랫폼의 진짜 주인공은 GPU가 아니라, 그 옆에 새로 붙은 CPU였어요.



수십억 에이전트를 위한 CPU, Vera

엔비디아 하면 GPU를 떠올리시죠. 그런데 이번에 엔비디아가 자체 설계한 데이터센터용 CPU Vera(베라)를 전면에 내세웠어요. 그것도 '에이전트를 위한 CPU'라는 분명한 명분과 함께요.

사람을 위한 CPU에서, 에이전트를 위한 CPU로

젠슨 황의 표현이 인상적이었어요. 과거엔 사람이 쓰라고 CPU를 만들었지만, 이제는 수십억 개의 에이전트가 쓸 CPU를 만든다는 거예요. 실제로 그는 "AI 에이전트가 가장 큰 컴퓨팅 소비자가 될 것"이라고 못 박았어요. 이 발언은 TradingKey 보도에도 정리돼 있어요.

왜 에이전트엔 다른 CPU가 필요할까요? 사람은 답을 한 번 받으면 잠깐 읽고 생각해요. 반면 에이전트는 한 작업을 처리하면서 도구를 부르고, 결과를 받고, 다시 다음 단계를 호출하는 식으로 짧은 왕복을 수없이 반복해요. 이 왕복 하나하나가 느리면 전체가 줄줄이 밀리죠.

지연시간이라는 진짜 병목

여기서 핵심 개념이 지연시간(latency)이에요. 식당으로 치면 주문을 넣고 음식이 나오기까지 걸리는 시간이죠. 손님 한 명이라면 별것 아니지만, 에이전트는 한 작업에서 수십 번씩 주방을 들락거려요. 그래서 작은 지연도 쌓이면 치명적이에요.

Vera CPU가 88개 코어와 초저지연 설계를 강조한 게 그래서예요. 에이전트가 GPU와 끊임없이 주고받는 그 짧은 왕복을, 최대한 매끄럽게 만들기 위한 칩이라는 거죠. The Next Web 보도에 따르면 엔비디아는 칩과 랙을 하나의 시스템으로 설계해 세계에서 가장 낮은 추론 토큰 비용을 달성했다고 밝혔어요.

정리하면 Vera는 데이터센터 쪽 답이에요. '에이전트를 대규모로 돌리는 공장'을 더 싸고 빠르게 만드는 칩이죠. 그런데 엔비디아는 같은 키노트에서, 정반대 끝에 있는 답도 함께 꺼냈어요.

GTC 2026 대만에서 Vera CPU를 설명하고 있는 젠슨황

[GTC 2026 대만에서 Vera CPU를 설명하고 있는 젠슨황 출처]

에이전트가 노트북으로 내려왔어요, RTX Spark

데이터센터 이야기만 하던 엔비디아가, 이번엔 개인용 PC로 시선을 돌렸어요. 바로 RTX Spark예요. 엔비디아가 만든 첫 Windows PC용 칩이자, 회사가 그동안 발을 들이지 않았던 영역으로의 진입이죠.

도구에서 팀원으로

엔비디아는 RTX Spark를 "개인 AI 에이전트 시대를 위해 Windows PC를 재발명한 칩"이라고 소개했어요. 그러면서 컴퓨터가 단순한 '도구'에서 '팀원(teammate)'으로 바뀐다고 표현했죠. 사용자가 시키면 PC가 알아서 일을 해내는, 한마디로 '개인용 AI 컴퓨터'라는 거예요. 공식 설명은 NVIDIA 뉴스룸에서 볼 수 있어요.

왜 지금 노트북일까요? 엔비디아의 진단은 이래요. 에이전트는 변곡점을 맞았지만, 정작 많은 사람이 자기 PC에서 에이전트를 안전하고 사적으로 돌리지 못하고 있다는 거예요. 민감한 데이터를 클라우드에 올리기 부담스러운 작업도 많고요. 그 빈자리를 직접 채우겠다는 게 RTX Spark의 명분이에요.

한 칩에 담긴 것

RTX Spark는 CPU와 GPU를 한 패키지에 합친 형태예요. 사양을 한눈에 정리하면 이래요.

항목

RTX Spark 사양

CPU

20코어 Arm Grace (MediaTek 공동 설계)

GPU

블랙웰 RTX, CUDA 코어 6,144개, FP4 지원

메모리

최대 128GB 통합 LPDDR5X

AI 성능

최대 1 PFLOP

대역폭

NVLink-C2C 600GB/s

출시

2026년 가을, ASUS·Dell·HP·Lenovo·MS Surface·MSI

숫자가 낯설 수 있는데, 두 가지만 짚을게요. 먼저 통합 메모리 128GB. CPU와 GPU가 책상 하나를 같이 쓴다고 보면 돼요. 보통은 GPU 책상(VRAM)이 좁아서 큰 모델을 올릴 때 쩔쩔매는데, 책상을 128GB까지 넓혀 노트북에서도 제법 큰 모델을 돌릴 여지를 준 거예요.

또 하나는 NVLink-C2C 600GB/s라는 대역폭이에요. CPU와 GPU 사이를 오가는 데이터의 고속도로 차선 수라고 보면 되는데, 엔비디아는 이게 PCIe Gen5의 약 5배라고 설명했어요. 차선이 넓을수록 에이전트가 주고받는 데이터가 덜 막히죠. 자세한 사양은 Tom's Hardware 보도에 정리돼 있어요.

클라우드에서 노트북까지, 하나의 스택

RTX Spark가 단독 제품이 아니라는 점이 중요해요. 엔비디아는 마이크로소프트와 손잡고 Windows 디바이스부터 클라우드, 로컬까지 에이전트를 한 스택으로 배포하는 그림을 함께 발표했거든요. 같은 에이전트가 상황에 따라 클라우드에서도, 내 노트북에서도 돌 수 있게 하겠다는 거예요. 관련 발표는 NVIDIA 블로그에서 다뤘어요.

[GTC 2026 대만에서 RTX Spark를 설명하고 있는 젠슨황 출처]

데이터센터에서 노트북까지, 엔비디아가 그리는 그림

두 칩을 나란히 놓으면 방향이 보여요. 한쪽 끝엔 수십억 에이전트를 돌리는 데이터센터용 Vera가 있고, 반대쪽 끝엔 한 사람의 책상 위에서 에이전트를 돌리는 RTX Spark가 있어요. 엔비디아는 이 양 끝을 자기 칩으로 직접 메우려는 거예요.

즉, '에이전트가 어디서나 돌게 만든다'는 한 문장이 이번 키노트 전체를 관통해요. 거대한 AI 팩토리부터 슬림한 노트북까지, 에이전트가 흐를 수 있는 연속적인 길을 깔겠다는 거죠. 이 흐름을 잘 보여주는 건 키노트 직후 공개된 GTC 타이베이 키노트 라인업이에요.

여기서 AI 애플리케이션을 만드는 입장이라면 한 가지가 분명해져요. 내 에이전트가 클라우드에서 도는지, 사용자 디바이스에서 도는지에 따라 필요한 인프라가 완전히 달라진다는 거예요. 대규모 학습과 서빙은 여전히 데이터센터 GPU의 영역이고, 그 토대(하드웨어·시스템 구성·라이브러리) 위에서 비로소 에이전트가 돌아가요. 화려한 키노트의 밑바닥엔 결국 인프라 설계가 깔려 있는 셈이죠.



젠슨 황의 서울 일주일

키노트가 끝나고, 젠슨 황은 곧장 한국으로 왔어요. 작년 가을 경주 APEC '치맥 회동' 이후 약 7개월 만의 재방문이었죠. 별다른 행사 없이 파트너 기업만을 겨냥한 순수 사업 목적이라는 점에서 더 주목받았어요. 일정을 테마로 묶어보면, 키노트에서 본 방향과 정확히 겹쳐요.

게이밍 — 첫 일정은 PC방이었어요

6월 5일 입국 직후 첫 일정이 홍대 PC방이었다는 게 상징적이에요. 프로게임단 T1의 페이커를 만나 RTX Spark를 보여줬죠. 이후엔 강남의 PC방을 돌며 크래프톤 장병규 의장, 엔씨소프트 김택진 대표 같은 게임사 수장들과도 만났어요. 신작 '아이온2' 행사 현장에서 김택진 대표 앞에 RTX Spark 비전을 직접 풀어놓자, 김 대표도 처음 들어봤는데 너무 좋다며 호응했다고 해요. 관련 장면은 ZDNet 코리아 보도에 담겼어요.

'개인용 AI 컴퓨터'를 가장 잘 보여줄 무대로 게이밍을 고른 셈이에요. 게임사들이 쌓아온 가상 물리 세계 구현 역량이 로봇·자율주행 같은 피지컬 AI 학습과 맞닿는다는 점도, 이 만남이 단순한 팬서비스가 아니었음을 말해줘요.

방한 첫 일정으로 페이커를 만난 젠슨황

[방한 첫 일정으로 페이커를 만난 젠슨황 출처]

반도체 공급망 — 삼겹살집의 총수 회동

방한 기간 동안 SK·현대차·LG·네이버 등 국내 대기업 총수들과 삼겹살 회동이 이어졌어요. 핵심 의제 중 하나는 메모리였어요. 젠슨 황은 입국 직후 삼성전자·SK하이닉스·마이크론 세 곳 모두 베라 루빈용 HBM4 공급사 자격을 통과해 양산에 들어갔다고 확인했거든요. 하반기 물량이 상반기보다 훨씬 클 거라는 말과 함께요. 관련 내용은 연합뉴스 보도에서 확인할 수 있어요.

젠슨황과 SK·현대차·LG·네이버 등 국내 대기업 총수들과 삼겹살 회동

[젠슨황과 SK·현대차·LG·네이버 등 국내 대기업 총수들과 삼겹살 회동 출처]

피지컬 AI와 로보틱스 — 네이버 1784

젠슨 황은 방한 내내 일관된 메시지를 던졌어요. 한국은 글로벌 제조 허브이고, 로보틱스가 한국의 다음 주요 산업이 될 거라는 거였죠. 그래서 로봇·클라우드·디지털 트윈 기술이 모인 네이버 제2사옥 '1784' 방문이 의미가 컸어요. GPU 공급 확대와 피지컬 AI 협력이 논의된 것으로 알려졌어요. 이 흐름은 NVIDIA 공식 블로그의 방한 정리에도 담겨 있어요.

소버린 AI와 대중 접점

국내 AI 스타트업 간담회에선 생성형 AI와 소버린 AI, 인프라 협력 방안이 오갔어요. 한편으로는 예능 '유 퀴즈 온 더 블럭' 녹화와 프로야구 시구처럼 대중과 만나는 일정도 챙겼고요. 기술·산업·대중을 한 번에 훑은 일주일이었어요.



정리하자면

이번 GTC 타이베이 키노트의 키워드는 'AI 에이전트'였어요. 데이터센터용 Vera CPU와 개인용 RTX Spark는 그 양 끝을 메우는 두 개의 칩이고요. 엔비디아는 거대한 AI 팩토리부터 한 대의 노트북까지, 에이전트가 어디서나 돌 수 있는 길을 깔고 있어요.

젠슨 황의 서울 일주일도 같은 방향을 가리켰어요. 게이밍에서 개인용 AI를, 총수 회동에서 메모리 공급망을, 네이버 방문에서 로보틱스를 짚었으니까요. 무대 위 발표와 거리의 행보가 결국 한 이야기였던 셈이죠.

에이전트가 어디서나 돈다는 건, 그 에이전트를 떠받치는 인프라도 그만큼 촘촘해져야 한다는 뜻이에요. 화려한 칩 발표 아래에서, 진짜 승부는 늘 그 토대를 어떻게 설계하느냐에서 갈려요.

Newsletter

AI 인프라 인사이트, 메일로 받아보세요

GPU 시세 동향, 신제품 출시, 인프라 구축 기술 가이드를 월 2회 정리해 보내드립니다.

엑스디노드를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.

엑스디노드를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.

엑스디노드를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.