[엔비디아④] 성능보다 무서운 '탈출 불가' 생태계, 엔비디아가 설계한 거대한 소프트웨어 덫

모델은 공짜, 운영은 유료? "한 번 발 들이면 못 나간다"… 전 세계 기업을 줄 세운 엔비디아의 길목 전략

2026-03-21     최기형 기자
사진=NVIDIA, K trendy NEWS DB ⓒ케이 트렌디뉴스 무단전재 및 수집, 재배포금지

[KtN 최기형기자]GTC 2026에서 엔비디아가 보여준 가장 큰 변화는 칩보다 소프트웨어에 있었다. 새 GPU와 CPU, 네트워크 장비가 쏟아졌지만 무대의 안쪽을 떠받친 것은 모델과 실행 도구, 배포 환경, 운영 체계였다. 엔비디아는 이번 행사에서 AI를 더 잘 학습시키는 회사보다 AI를 더 잘 깔고 더 오래 돌리는 회사에 가까운 모습을 보였다. 질문을 잘 받는 모델 하나를 만드는 일보다, 기업 안에서 모델이 실제로 움직이게 만드는 길목을 먼저 쥐겠다는 계산이 선명했다.

AI 산업은 지난 2년 동안 모델 이름과 성능표를 중심으로 흘러왔다. 어느 모델이 더 길게 읽는지, 어느 모델이 더 정확히 답하는지, 어느 회사가 더 많은 그래픽처리장치를 확보했는지가 시장의 관심을 끌었다. 그러나 기업이 실제로 돈을 쓰기 시작하면 계산이 달라진다. 모델을 하나 고르는 일보다 더 어려운 일은 배포다. 사내 문서와 연결해야 하고, 권한을 나눠야 하고, 외부 도구를 불러와야 하고, 개인정보와 기밀을 걸러야 하고, 장애가 났을 때 흔적을 남겨야 한다. 모델 성능은 출발점일 뿐이고, 예산은 운영 과정에서 더 많이 탄다. 엔비디아는 바로 그 부분을 이번 GTC에서 집요하게 파고들었다.

네모트론은 이번 행사에서 단순한 오픈 모델 묶음이 아니었다. 엔비디아는 언어와 추론, 비전, 로보틱스, 자율주행, 바이오, 기상까지 각기 다른 분야의 모델 계열을 하나의 우산 아래 세웠다. 그 목적은 분명하다. 기업 고객이 여러 벤더의 모델을 따로 모아 쓰기보다, 엔비디아가 정리한 모델 계열 안에서 필요한 작업을 고르는 방식으로 들어오게 만들려는 것이다. 모델 경쟁이 치열할수록 플랫폼 사업자는 모델 위에 올릴 공통 실행 환경을 먼저 장악하려 든다. 엔비디아도 같은 길로 들어섰다.

NIM 마이크로서비스는 그 흐름에서 더 중요하다. 기업 입장에서 모델 파일 하나를 내려받는 일은 그리 어렵지 않다. 어려운 일은 모델을 안정적으로 서비스하는 일이다. 요청이 몰려도 끊기지 않아야 하고, 특정 작업에 맞게 최적화해야 하며, 여러 시스템과 연결될 수 있어야 한다. NIM은 그런 배포 구간을 정리하는 도구에 가깝다. 엔비디아가 칩보다 NIM 같은 층위를 더 많이 설명한 이유도 여기에 있다. 고객은 GPU만 사서 곧바로 서비스를 열 수 없다. 운영 환경이 붙지 않으면 모델은 실험실 안에 남는다. NIM은 엔비디아가 그 실험실 문턱을 낮추기 위해 꺼내 든 도구다.

사진=NVIDIA, K trendy NEWS DB ⓒ케이 트렌디뉴스 무단전재 및 수집, 재배포금지

다이나모도 같은 줄기에서 봐야 한다. AI 서비스는 한 번 띄워 놓으면 끝나는 일이 아니다. 요청량이 시시각각 바뀌고, 모델마다 필요한 자원이 다르고, 비용과 속도를 동시에 맞춰야 한다. 사용량이 늘수록 계산 자원을 어떻게 배분하느냐가 성능 못지않게 중요해진다. 다이나모는 그런 운영 단계를 겨냥한 이름이다. 엔비디아는 이제 칩이 몇 TFLOPS를 내느냐보다, 고객이 서비스 운영 비용을 얼마나 줄일 수 있느냐를 더 자주 말한다. 엔비디아가 반도체 회사에서 운영환경 회사로 옮겨가고 있다는 징후다.

이번 GTC에서 가장 눈길을 끈 이름 가운데 하나는 오픈클로였다. 엔비디아는 오픈클로를 여러 에이전트가 장시간 움직이는 환경의 중심축으로 올려놨다. 기업 업무는 짧은 질문 하나로 끝나는 경우가 드물다. 자료를 찾고, 다른 시스템을 불러오고, 계산하고, 다시 문장을 고치는 절차가 따라붙는다. 이런 작업은 단일 모델 하나로 처리하기보다 역할을 나눈 여러 AI가 동시에 움직이는 방식이 효율적이다. 오픈클로는 그런 조율을 맡는 틀로 제시됐다. 엔비디아가 오픈클로를 전면에 올린 까닭은 단순하다. AI 한 개가 아니라 AI 여러 개가 함께 일하는 시대가 오면, 그 흐름을 묶는 운영체제가 필요하기 때문이다.

오픈셸은 더 노골적으로 기업 시장을 겨냥한다. 생성형 AI를 도입하려는 기업이 가장 먼저 묻는 것은 성능이 아니다. 사내 자료가 외부로 새지 않는지, 누가 무엇을 불렀는지 기록이 남는지, 허용하지 않은 도구 접근을 막을 수 있는지가 먼저 나온다. 엔비디아는 오픈셸을 정책 집행과 네트워크 가드레일, 프라이버시 경로를 묶은 실행 환경으로 소개했다. 요약하면 “AI가 사내 시스템 안에서 사고치지 않게 묶는 울타리”에 가깝다. 모델 회사들이 종종 놓치는 지점이 여기다. 답을 잘하는 AI보다, 기업 규정을 어기지 않고 오래 돌아가는 AI가 더 비싸게 팔린다. 엔비디아는 이 점을 아주 일찍 알아챘다.

네모클로는 오픈클로와 오픈셸, 네모트론을 한 덩어리로 묶는 이름이다. 엔비디아가 굳이 새 이름을 따로 붙인 이유도 분명하다. 기업 고객은 모델과 실행 환경, 오케스트레이션을 따로 고르고 따로 붙이는 일을 가장 부담스러워한다. 하나가 잘 돌아도 다른 하나가 말썽을 일으키기 쉽기 때문이다. 엔비디아는 모델, 보안, 운영을 한 번에 묶어 들여오라는 식으로 길을 깔았다. 칩만 팔아서는 이런 방식이 나오기 어렵다. 하드웨어 위에 올릴 소프트웨어 층을 통째로 팔려는 회사만 이런 패키지를 만든다.

사진=NVIDIA, K trendy NEWS DB ⓒ케이 트렌디뉴스 무단전재 및 수집, 재배포금지

여기서 엔비디아의 사업 논리가 한층 분명해진다. 지금 AI 시장에서 가장 큰 돈은 모델 자체보다 모델이 일하는 환경에서 나온다. 모델은 바꿀 수 있다. 오늘은 이 모델을 쓰다가 내일은 다른 모델로 갈아탈 수도 있다. 그러나 기업 안에 배포된 실행 환경과 운영 도구, 보안 규칙, 데이터 연결 경로는 쉽게 바꾸기 어렵다. 한 번 자리 잡으면 오래 간다. 엔비디아가 네모트론을 오픈 모델로 풀면서도 NIM과 다이나모, 오픈셸, 네모클로를 함께 미는 까닭이 여기에 있다. 문을 열 때는 넓게 열어 두고, 안으로 들어온 뒤에는 운영 경로가 자기 쪽으로 굳어지게 만드는 구조다.

클라우드 협력도 같은 방식으로 읽어야 한다. AWS, 마이크로소프트, 구글, 오라클이 GTC 2026에서 빠지지 않고 등장한 이유는 단순한 파트너십 과시가 아니다. 기업용 AI는 한 군데에서만 돌아가지 않는다. 개발은 클라우드에서 하고, 중요한 데이터는 사내에 두고, 현장 장비는 엣지에서 돌리는 식으로 환경이 갈라진다. 엔비디아는 이런 갈라진 환경을 자사 모델과 실행 도구, 가속기 플랫폼으로 다시 한 줄로 묶으려 한다. 클라우드 사업자와 손잡는 동안 온프레미스와 로컬 장비를 함께 내놓는 방식도 그 계산과 맞닿아 있다. 어느 한 곳에서만 강해서는 기업 운영망을 장악할 수 없기 때문이다.

마이크로소프트와의 협력은 특히 상징적이다. AI 실험이 실제 서비스로 넘어가는 과정에서 가장 먼저 필요한 것은 모델보다 배포 경로다. 기업 고객은 새 모델이 나올 때마다 시스템을 다시 갈아엎을 수 없다. 익숙한 개발 환경과 통합 관리 도구 안에서 AI를 쓰고 싶어 한다. 마이크로소프트는 그 점에서 가장 강한 기업용 입구를 쥔 회사다. 엔비디아는 오픈 모델과 가속기 플랫폼, 추론용 인프라를 그 위에 올렸다. 누가 더 나은 모델을 만드는지와 별개로, 기업이 실제로 AI를 어디서 켜고 누구의 도구로 관리하는지가 중요해진 상황을 반영한 움직임이다.

AWS 쪽 발표도 비슷하다. 아마존은 인프라 사업자이고, 베드록은 모델을 고르고 붙이는 곳이다. 엔비디아는 여기에 네모트론을 얹고 강화학습 기반 미세조정까지 연결했다. 의미는 단순하다. 기업이 자기 산업에 맞는 모델을 고쳐 쓰려면 결국 클라우드 안에서 조정하고 배포해야 한다는 뜻이다. 법률, 의료, 금융처럼 규제가 많고 용어가 까다로운 분야일수록 일반 모델 하나로는 부족하다. 엔비디아는 그런 틈을 보고 모델과 배포 도구를 같이 밀어 넣고 있다. 엔비디아가 말하는 오픈 모델은 이상주의에 가까운 구호가 아니라, 기업별 맞춤형 조정을 더 쉽게 만들어 자사 인프라 사용량을 늘리려는 전략에 가깝다.

사진=더밀크, K trendy NEWS DB ⓒ케이 트렌디뉴스 무단전재 및 수집, 재배포금지

세일즈포스와 연결된 에이전트포스 사례도 지나치기 어렵다. 생성형 AI가 소비자용 서비스에 머무르지 않고 기업 업무 시스템 안으로 들어갈 때 가장 먼저 맞닥뜨리는 분야가 고객관리다. 고객 정보와 주문 기록, 영업 메모, 서비스 이력은 이미 기업 안에 쌓여 있다. 여기에 AI를 붙이면 상담 자동화, 요약, 추천, 분류가 바로 돈이 된다. 엔비디아는 네모트론을 이런 고밀도 기업 업무에 들어갈 모델로 밀고 있다. 소비자 챗봇 시장은 화제성이 크지만 수익 구조는 아직 불안정하다. 반면 기업 내부 업무 자동화는 도입까지 오래 걸려도 한 번 들어가면 잘 빠지지 않는다. 엔비디아가 이 시장을 놓치지 않으려는 이유가 분명하다.

개발자용 장비와 데이터센터급 장비를 함께 내놓은 방식도 소프트웨어 전략과 연결된다. DGX 스파크와 DGX 스테이션은 단순한 워크스테이션 소개가 아니었다. 개발자의 책상에서 시작한 작업을 엔비디아 생태계 안에서 곧바로 더 큰 시스템으로 옮겨가게 하는 입구다. 작은 실험이 같은 도구와 같은 모델, 같은 운영 방식으로 데이터센터까지 이어지면 고객은 중간에 다른 생태계로 옮길 이유가 줄어든다. 엔비디아는 개인 개발자, 스타트업, 대기업 연구팀, 하이퍼스케일 데이터센터를 서로 다른 시장으로 보지 않고 하나의 경로로 본다. 소프트웨어가 그 경로를 이어 붙이는 접착제 역할을 한다.

이 지점에서 CUDA의 기억이 다시 떠오른다. 엔비디아는 한때 GPU 성능만으로는 경쟁사를 영원히 따돌릴 수 없다는 사실을 알고 CUDA 생태계를 키웠다. 개발자가 한 번 CUDA에 익숙해지면 다른 환경으로 옮기기 어렵다는 점이 엔비디아의 가장 큰 무기가 됐다. GTC 2026에서 보인 소프트웨어 전략도 비슷하다. 네모트론, NIM, 다이나모, 오픈클로, 오픈셸, 네모클로는 에이전트 시대의 CUDA를 만들려는 시도로 읽힌다. 기업이 한 번 이 경로로 들어오면 모델, 배포, 보안, 운영을 한꺼번에 바꾸기 어려워진다. 엔비디아는 그 점을 노린다.

물론 이런 전략이 곧장 모두 성공한다고 볼 수는 없다. 오픈 모델 시장은 이미 경쟁이 치열하고, 클라우드 사업자들은 자체 칩과 자체 플랫폼을 키우고 있다. 마이크로소프트, AWS, 구글은 엔비디아와 협력하면서도 동시에 자사 생태계를 강화한다. 세일즈포스나 서비스나우처럼 기업용 소프트웨어 회사를 가진 사업자도 AI 운영망을 자기 쪽으로 끌어들이려 한다. 엔비디아가 소프트웨어 길목을 쥐려는 순간, 경쟁 상대는 반도체 회사에 그치지 않게 된다. 클라우드, 엔터프라이즈 소프트웨어, 오픈소스 커뮤니티, 모델 회사가 모두 경쟁자로 올라선다.

사진=더밀크, K trendy NEWS DB ⓒ케이 트렌디뉴스 무단전재 및 수집, 재배포금지

기업 고객 입장에서 봐도 부담은 남는다. 엔비디아가 내놓는 패키지는 매력적이지만, 한 회사 의존도가 높아질수록 비용 협상력은 약해진다. 하드웨어와 소프트웨어, 운영 환경을 한꺼번에 묶어 들여오면 초기 구축은 쉬워도 나중에 다른 선택지로 갈아타기 어렵다. AI 도입이 커질수록 기업들은 성능만이 아니라 종속 위험도 함께 따지게 된다. 엔비디아가 오픈 모델을 앞세우는 까닭도 그런 경계심을 누그러뜨리기 위한 측면이 있다. 닫힌 플랫폼처럼 보이지 않되, 실제 운영의 중심은 자기 쪽으로 흐르게 하는 방식이다.

그럼에도 GTC 2026에서 드러난 방향은 분명하다. 엔비디아는 더 이상 ‘더 빠른 GPU’를 앞세우는 회사로만 남아 있지 않다. 모델을 올리고, 실행하고, 통제하고, 조율하고, 대규모로 배포하는 과정 전체를 자사 사업 영역으로 끌어들였다. 기업용 AI가 실험실에서 빠져나와 사무실과 공장, 물류창고와 고객센터로 들어갈수록 돈은 모델 그 자체보다 운영 경로로 몰린다. 엔비디아는 그 흐름을 누구보다 빨리 읽고 움직였다.

실적과 함께 보면 의미는 더 또렷해진다. 데이터센터 연매출 1937억달러를 만든 회사가 오픈 모델과 배포 도구, 운영 체계를 한꺼번에 내놓았다는 사실은 단순한 기술 시연과 거리가 멀다. 이미 벌어들인 돈을 바탕으로 다음 시장의 길목을 선점하려는 행동에 가깝다. 모델 성능 경쟁은 앞으로도 계속되겠지만, 기업들이 장기적으로 더 큰 돈을 쓰는 자리는 배포와 운영이다. 엔비디아는 GTC 2026에서 바로 그 자리를 정면으로 겨눴다. 칩 회사가 소프트웨어 회사를 흉내 낸 것이 아니라, 운영환경 사업자로 몸집을 바꾸는 장면이었다.