본문 바로가기
반도체, 소.부.장.

반도체 기업 탐구: 엔비디아(Nvidia)는 독주체제를 이어갈 것인가?

by 뜨리스땅 2023. 8. 26.
728x90
반응형

1. 엔비디아의 현 위치: 단순 Chip 판매가 아닌 생태계까지 구축

 

 

엔비디아의 GPU 독주 체제가 당분간 계속될 것이라는 분석이 나왔다. 다른 기업이 따라잡기에는 이미 '엔비디아 생태계'가 견고하게 구축됐기 때문이라는 이유다.

 



뉴욕타임스(NYT)는 21일(현지시간) 월스트리트가 엔비디아의 AI 반도체 실적이 하반기에도 시장 기대치를 크게 웃돌 것으로 예측했다고 보도했다.

이에 따르면 전문가들은 엔비디아가 당분간 AI 반도체 시장에서 유일무이한 입지를 갖출 것이라는 예측을 내놓고 있다. 그 이유로 엔비디아가 단순히 최고 성능을 갖춘 제품을 내놓는 것을 넘어, 소프트웨어와 관련 리딩 업체를 포함한 '해자'를 구축했다는 분석이다.

실제로 지난 10여년 사이 AI 인프라는 엔비디아 GPU로 정리됐다. 오픈AI를 비롯해 마이크로소프트, 구글, 아마존, 메타 등 빅테크뿐 아니라 모든 AI 관련 기업은 엔비디아 GPU를 사용해 AI를 개발, 서비스하고 있다.

엔비디아 GPU가 뜬 것은 성능 때문이다. 엔비디아의 GPU가 생성 AI 분야에서 초반부터 성능을 검증받아 널리 활용되기 시작하며 시장을 선점했다.

본래 창업자 젠슨 황은 게임을 너무 좋아해서 게이머를 위해 GPU를 설계했으나 'BERT' 등 생성 AI 초기 모델이 나오던 2017년부터 단순한 그래픽을 매우 많은 픽셀에 단순한 연산을 동시에 대량으로 하는 연산 구조가 인공지능의 대량 정보 학습에 좋은 구조를 가지고 있다는 것을 깨닫게 되었다.

 

2016년 이후의 주요 사업이 게임용(콘솔, PC와 노트북) GPU의 디자인에서 인공지능 컴퓨팅을 위한 GPU의 디자인으로 바뀌었다. CPU와 DPU를 더불어, 인공지능 컴퓨팅을 목적으로 학습할 데이터를 위한 반도체 전기회로를 디자인하는 것이다.

 

게임 그래픽카드 사업에서 인공지능 GPU 디자인 사업을 엔비디아의 주 사업 목적으로 삼게 되었고, 이후 2년 주기로 더 성능이 우수한 칩을 꾸준히 출시하며 경쟁사와의 격차를 벌리고 있다.

 

2024년 출시 에정인 AI용 슈퍼칩 'GH200' (사진=엔비디아)

 

현재 GPU 시장은 엔비디아가 80% 이상을 점유 중인 독점 구조다. 하드웨어만 보면 대체재가 없지 않지만, 내면을 보면 하드웨어를 교체하기 쉽지 않은 상황이다. 비결은 엔비디아 GPU를 기반으로 하는 쿠다(CUDA) 소프트웨어 생태계다. 오늘날 널리 쓰이는 AI 개발 프레임워크와 각종 라이브러리, 도구 등은 엔비디아 GPU에 최적화돼 있다. 엔비디아 GPU를 벗어나선 생성 AI를 개발하는 게 불가능한 실정이다.

엔비디아는 GPU 프로세서를 개발하는데 멈추지 않고 AI 개발을 지원하는 핵심 소프트웨어를 개발함으로써 시장을 장악할 수 있었다. 회사를 부품 공급업체에서 AI 개발을 위한 원스톱 플랫폼으로 만드는 데 투입한 비용은 지난 10년 동안 300억달러(약 40조원) 이상이라고 밝혔다. 

최근에는 과학자 및 스타트업과 협력하는 것 외에도 대형언어모델(LLM) 개발 및 머신러닝 전문 등 AI에 직접 참여하는 팀을 구성했으며, 쿠다를 넘어 여러 계층의 핵심 소프트웨어 스택을 개발했다.

더불어 AI 작업을 효율적으로 수행하기 위해 독점 네트워킹 기술과 수천개의 GPU를 사용해 조립하고 운영하는 슈퍼컴퓨터를 판매하기 시작했다. 젠슨 황 엔비디아 CO는 "단순히 칩을 만드는 것으로 부족하며, 전체 데이터 센터 구축이 필요하다"며 자신을 보였다.

 

 

 

2. 엔비디아의 주력 제품과 독점력

 

현재 최고 사양 GPU인 H100 GPU 탑재 서버는 대당 수억원에 판매된다. H100의 절반 정도 가격에 구매할 수 있는 A100 텐서코어 GPU도 H100만큼은 아니지만 서버 한대당 수억원대에 팔린다. 높은 가격에도 불구하고 구할 수 없어서 배달까지 최대 12개월 걸릴 정도로 인기다. 대규모로 H100과 A100 인프라를 구축한 마이크로소프트나 구글, 아마존 같은 기업이 수천대 규모의 GPU 서버팜을 운용한다.

또 엔비디아는 최근 스타트업 코어위브에 자금과 H100 GPU를 공급하면서 클라우드 서비스를 시작했다. 이를 통해 기업은 AI 컴퓨팅 인프라를 구입하는 대신 컴퓨팅 인프라를 임대할 수 있다.

이런 이유로 AI 리딩 업체들은 엔비디아의 최신 제품을 앞다퉈 도입하고, 이를 발판 삼아 엔비디아는 관련 인프라를 확장하는 순환을 반복해 왔다.

이 때문에 일부 경쟁사는 "프로세서뿐 아니라 컴퓨터, 소프트웨어, 클라우드 서비스, AI 모델까지 판매하는 회사와 경쟁하기는 사실상 어렵다"고 하소연하기에 이르렀다. 10년 전부터 경쟁 AI 칩을 만들기 시작한 구글조차도 일부 작업을 위해 엔비디아의 GPU에 의존하는 실정이다. 

올 하반기부터 GPU 경쟁 제품을 내놓는 리사 수 AMD CEO는 "모두가 다 끝났다고 말해도, 다 끝난 것은 아니다"라고 희망을 밝혔다.

하지만 NYT는 "AMD, 인텔, 구글, 아마존, 메타, IBM 등 빅테크와 세레브라스, 삼바노바 등 스타트업들이 경쟁 제품을 보유하고 있지만, 엔비디아의 기술력을 따라잡기는 아직 역부족"이라는 평가를 내놓았다.

결국 엔비디아가 AI 반도체 수요 증가의 수혜를 독차지하는 상황이 당분간 이어질 것으로 전망된다는 분석이다.

 

 

 

3. 생태계의 핵심: 쿠다 (CUDA)

 

CUDA("Compute Unified Device Architecture", 쿠다)는 그래픽 처리 장치(GPU)에서 수행하는 (병렬 처리) 알고리즘을 C 프로그래밍 언어를 비롯한 산업 표준 언어를 사용하여 작성할 수 있도록 하는 GPGPU 기술이다.

 

CUDA는 엔비디아가 개발해오고 있으며 이 아키텍처를 사용하려면 엔비디아 GPU와 특별한 스트림 처리 드라이버가 필요하다. CUDA는 G8X GPU로 구성된 지포스 8 시리즈급 이상에서 동작한다. CUDA 플랫폼은 컴퓨터 커널의 실행을 위해 GPU의 가상 명령 집합과 병렬 연산 요소들을 직접 접근할 수 있는 소프트웨어 계층이다.

개발자는 패스스케일 오픈64 C 컴파일러로 컴파일 된 '쿠다를 위한 C' (C언어를 엔비디아가 확장한 것)를 사용하여 GPU 상에서 실행시킬 알고리듬을 작성할 수 있다. 쿠다 구조는 일련의 계산 인터페이스를 지원하며 이에는 OpenCL, DirectX Compute가 포함된다. 

 

C 언어가 아닌 다른 프로그래밍언어에서의 개발을 위한 래퍼(Wrapper)도 있는데, 현재 파이썬, 펄, 포트란, 자바와 매트랩 등을 위한 것들이 있다. 이러한 접근성은 병렬 프로그래밍 전문가들이 GPU 리소스를 쉽게 이용할 수 있게 해주며, 이는 그래픽스 프로그래밍의 고급 기술을 요구하였던 Direct3D와 OpenGL과 같은 이전 API 솔루션들과 대비된다. 또, CUDA는 OpenACC와 OpenCL과 같은 프로그래밍 프레임워크를 지원한다.

최신 드라이버는 모두 필요한 쿠다 콤포넌트를 담고 있다. 쿠다는 모든 엔비디아 GPU (G8X 시리즈 이후)를 지원하며 이 대상에는 지포스, 쿼드로, 테슬라 제품군이 포함된다. 엔비디아는 지포스 8 시리즈를 위해 개발된 프로그램들이 수정 없이 모든 미래의 엔비디아 비디오 카드에서 실행될 것이라고 선언하였다.

쿠다를 통해 개발자들은 쿠다 GPU 안 병렬 계산 요소 고유의 명령어 집합과 메모리에 접근할 수 있다. 쿠다를 사용하여 최신 엔비디아 GPU를 효과적으로 개방적으로 사용할 수 있다. 그러나 CPU와는 달리 GPU는 병렬 다수 코어 구조를 가지고 있고, 각 코어는 수천 스레드를 동시에 실행시킬 수 있다. 응용 프로그램이 수행하는 작업(계산)이 이러한 병렬처리연산에 적합할 경우, GPU를 이용함으로써 커다란 성능 향상을 기대할 수 있다.

컴퓨터 게임 업계에서는 그래픽 랜더링에 덧붙여, 그래픽 카드의 게임 물리 계산 (파편, 연기, 불, 유체 등 물리 효과)에 사용되며, 예로는 피직스와 불렛이 있다. 쿠다는 그래픽이 아닌 응용 프로그램, 즉, 계산 생물학, 암호학, 그리고 다른 분야에서 10배 또는 그 이상의 속도 혜택을 가져왔다. 이 한 예는 BOINC 분산 계산 클라이언트이다.

쿠다는 저수준 API와 고수준 API 모두를 제공한다. 최초의 CUDA SDK는 2007년 2월 15일에 공개되었으며 마이크로소프트 윈도우와 리눅스를 지원했다. OS X 지원은 2.0 버전에 추가되었다.


출처 : AI타임스, 위키피디아

 

뜨리스땅

 

 

 

https://tristanchoi.tistory.com/389

 

로봇 기업 탐구: 테슬라 vs. 엔비디아

인공지능에 필요한 데이터를 가장 잘 다룰 수 있는 업체가 테슬라와 엔비디아 인공 신경망의 활용, 자연어처리 알고리즘의 발전 및 확산, 강화학습의 발전은 로봇의 뇌가 2019 년 대비 크게 도약

tristanchoi.tistory.com

 

728x90
반응형

댓글