NEW BOT Телеграм, страница

#AI

AI 컴퓨팅 밸류체인

170 views18:24

250929_AI Infrastructure. Compute is the New Oil - RAISE Summit 2025

https://www.youtube.com/watch?v=n3QdWygAzXg

[Implication]

(1) Neo-Cloud의 공통적인 핵심 성장 동력은 1) AI 인프라 건설 속도, 2) 특정 AI 워크로드에 대한 전문성, 3) 클라우드 계층[스택]의 복잡성을 해결[스택 내 전문 업체와의 협력을 통한 편리한 UI/UX 제공]하는 것
*다만, 패널들은 각자의 비즈니스 모델 및 스택에서의 포지셔닝에 따라 세부적인 부분에서는 서로 다른 견해를 보임

(2) 또한 기존 CSP[AMZN/MSFT/GOOGL] 업체들과 경쟁하기 위해서는 위의 3가지 요소와 함께 4) 소버린 AI 및 엔터프라이즈 타겟 전략, 5) 상대적으로 낮은 가격이 돌파구가 될 전망

(3) 한편 NVIDIA의 추론 라이브러리, 마켓 플레이스 확대 등은 Neo-Cloud 업체들에게 큰 위협이 될 수 있도 있어 보임

-

[Contents]

(1) AI 인프라는 새로운 석유. 20세기 성장이 에너지 기반이었다면, 21세기 성장은 명백히 AI가 주도

(2) AI는 막대한 양의 에너지를 소비하며 인프라의 중요성을 더욱 더 부각 시킴

(3) 과거 클라우드 시대에는 저렴한 CPU 서버의 Multi-tenancy와 가상화가 핵심

(4) 당시 하이퍼스케일러들은 이 목적에 맞는 맞춤형 CPU와 네트워크 칩을 개발

(5) 그러나 현재는 모든 것이 GPU와 AI 인프라를 중심으로 재편되는 중

(6) GPU는 가격이 매우 비쌈. GPU 리소스를 잘게 쪼개서 "필요할 때만 쓰세요"라고 팔면, 유휴 시간이 발생 했을 때 손실을 감당할 수 없는 구조

(7) 이런 구조는 장기 계약으로의 변화, 즉 비즈니스 모델의 구조적 변화를 야기

(8) AI는 관련 기업의 자금조달, 데이터센터 계약 구조, 클라우드 업체들의 S/W 운영 방식 등 모든 것에 근본적인 변화를 요구

(9) 오늘 이 자리에는 해당 변화를 주도하는 다양한 배경의 Neo-Cloud 업체들이 모임

(10) Neo Cloud가 기존 CSP 업체를 상대로 경쟁할 수 있는 가장 큰 무기는 1) 속도, 2) 전문화

(11) 기존 CSP는 모든 고객에게 모든 것을 제공하는 아웃소싱 IT 솔루션에 가까움

(12) 반면 우리는 오직 '특정 AI 워크로드'에만 집중

(13) 이러한 극도의 집중/전문화가 기존 CSP를 능가하는 경쟁력의 원천

(14) AI 컴퓨팅 아키텍처는 극적으로 변화하고 있으며 전력, 냉각 시스템, 데이터센터 설계 등 물리 인프라의 모든 것이 바뀌고 있음

(15) 대기업 의사 결정 구조는 본질적으로 느릴 수밖에 없으며, 수많은 승인 절차가 많은 PJT의 지연을 유발

(16) Crousoe는 100MW급 데이터센터를 300일 만에 구축. 이제는 200일로 단축 중

(17) *Lambda는 최종 사용자가 GPU에 접근하는 속도에 집중
*SK그룹과 협력하고 있음

(18) 복잡한 클러스터를 원클릭으로 쉽게 생성, 15분 단위로 리소스를 빌려 쓸 수 있게 해서 접근성을 극대화

(19) 반면 기술적 과제도 존재. 바로 복잡성과의 싸움

(20) 대규모 GPU 클러스터를 구축/운영하기 위해서는 가상화부터 쿠버네티스, 다중 네트워크까지 모든 복잡성을 해결해야 함

(21) 특히 엄격한 멀티테넌시를 계층의 가장 낮은 단계부터 구현해야 하는 것이 어려움

(22) 즉, 하나의 GPU 클러스터를 A/B 기업이 동시에 공유해서 사용할 때 서로의 자원이 절대로 섞이지 않도록 강력하게 격리해야 함

(23) 클라우드 스택은 1) H/W 계층[GPU/CPU/메모리], 2) 가상화 계층[쿠버네티스/하이퍼바이저], 3) 플랫폼 계층[AI 프레임워크/개발 환경], 4) 서비스 계층[API]으로 구성

(24) 멀티테넌시를 상위 계층[서비스]에서만 처리하면 보안/성능의 문제가 생김

(25) 따라서 H/W나 펌웨어 레벨부터 리소스를 강력하게 분리해야 함

(26) GPU/네트워크는 원래 단일 사용자에 최적화된 경우가 많은데, 이를 강제로 나누면 성능 저하/드라이버 충돌 등이 발생

(27) Lambda는 NVDA의 인피니밴드를 포함한 3개의 네트워크 패브릭을 동시 분할하는 가상화 S/W를 자체 개발

(28) 이 기술 덕분에 8,000개의 GPU 클러스터를 다양한 크기의 하위 클러스터로 동적으로 분할하여 제공할 수 있게 됨

(29) *Mirantis는 이러한 복잡한 환경 설정을 '템플릿화'하여, 인프라에 대한 고난이도 기술 없이도 Neo-Cloud가 빠르게 서비스를 시작할 수 있도록 도와 주는 역할
*Mirantis는 클라우드 네이티브 인프라 관리 회사. 쿠버네티스/OpenStack/컨테이너 플랫폼 구축 자동화를 도와줌. 네오클라우드 업체에게 자동화된 설정 패키지를 제공
■ GPU 클러스터 템플릿→GPU + 네트워크+스케줄러 세팅 자동화
■ 보안/멀티테넌시 템플릿→테넌트 격리 정책 자동 반영
■ 모니터링 템플릿→Prometheus+Grafana 대시보드 자동 구축

(30) 결국 AI 인프라는 RDMA 패브릭/가상화/멀티테넌시 등 모든 것을 관리해야 함

(31) 또한 개별 GPU/트랜시버/네트워크 등 클라우드 스택 전반에서 발생할 수 있는 문제에 대비도 필수

(32) 한편, 소버린 AI는 이제 마케팅이 아니라 현실

(33) 특히 유럽에서는 에너지 생산~데이터 주권에 이르기까지 모든 밸류체인에서 주권에 대한 인식이 커지고 있음

(34) Sesterce의 임무는 유럽이 자체 인프라/데이터센터/컴퓨팅/에너지를 소유할 수 있게 하는 것
*글로벌 컴퓨팅 파워의 60% 미국, 5% 유럽

(35) 이 격차를 메우기 위해 Sesterce는 프랑스에 GW급 AI 팩토리 건설을 추진. Nebius 역시 소버린 AI 흐름에서 유사한 역할

(36) Neo Cloud 주요 시장은 엔터프라이즈향이 될 것

(37) 현재 대부분의 기업은 '혼란스럽다/쓰던게 아니다'라는 이유로 2~3배 비싼 CSP를 이용

(38) 우리는 엔터프라이즈 시장으로 진출하기 위해 단순히 인프라를 판매하는 것에서 벗어나야 함

(39) 추론, 플랫폼 서비스와 같은 상위 솔루션을 판매가 절실

(40) 기존 CSP 업체들이 강력한 이유는 기술에 필요한 모든 것을 서비스로 제공하는 거대한 생태계를 구축했기 때문

(41) 기업 입장에서 CSP에서 Neo Cloud로 전환하는 비용은 매우 높기도 함

(42) Neo Cloud가 엔터프라이즈 시장을 공략하기 위해서는 스택 위로 올라가는 것 외에 선택의 여지가 없음

(43) 추론 플랫폼이 그 첫 단계가 될 것. 이후 ML 오케스트레이션, 엔터프라이즈 AI 플랫폼으로 확장 전망

(44) Nebius는 자체 개발과 더불어 전문 솔루션 기업과의 파트너십을 중요한 전략으로 보고 있음

(45) Ford가 정제 시설이나 정유소를 운영하지 않는 것처럼, 각 계층에는 전문화된 승자가 존재할 것

(46) 즉, 스택의 모든 단일 계층에서 수천억 달러 규모의 비즈니스가 탄생 전망

(47) 또한 시장 구조는 각 계층에 존재하는 해자의 형태에 따라 결정 될 것

(48) 네트워크 효과가 강한 분야에서는 승자 독식이, 규모의 경제가 중요한 분야는 과점 형태가 될 것

(49) Sesterce는 오히려 컴퓨팅에서 에너지로, 즉 밸류체인 아래로 내려가는 전략을 취함

(50) 미래에는 S/W 개발 주기가 극도로 짧아져 프롬프트 입력만으로 서비스가 생성될 수 있기 때문

(51) 그럴 경우 진정한 해자는 에너지, 고품질의 물리적 인프라 운영 능력이 될 것

(52) Crusoe의 경우 반도체부터 데이터센터, 토큰까지 수직 통합을 통해 모든 계층 솔루션 제공을 목표

-

[Panelists]
■ Roman Chermin: Co-founder & CBO, Nebius
■ Youssef El Manssouri: Co-founder & CEO, Sesterce
■ Shaun O'Meara: CTO, Mirantis
■ Stephen Balaban: Co-founder & CEO, Lambda
■ Chase Lochmiller: Co-founder & CEO, Crusoe
■ Dylan Patel: Founder & CEO, Semianalysis

YouTube

RAISE Summit 2025: AI Infrastructure. Compute is the New Oil

At RAISE Summit’s Infrastructure is the New Oil panel, AI infrastructure leaders from Nebius, Sisters, Mirantis, Lambda, and Crusoe dive deep into how startups are outpacing hyperscalers with gigawatt-scale data centers, sovereign clouds, and AI-native software…

107 views03:28