본문 바로가기
반도체, 소.부.장.

반도체 산업 탐구: 비 메모리의 미래 - 인공지능 AI

by 뜨리스땅 2023. 3. 26.
728x90
반응형

0. Overview

 

최근 PC, 모바일, 서버 이후 새로운 반도체 수요처에 대한 관심이 크다. 이들의 공통점은 AI다. 다양한 분야에 걸쳐 AI 응용처들이 나타날 것으로 예상된다. 신규 수요처들이 메모리, 비메모리 각각의 수요에 실제 어떤 영향을 미칠 수 있 을지에 대해 생각해 볼 필요가 있다. 인공지능 활용의 핵심은 학습과 추론이다. 이 때 반도체 수요에 미치는 영향은 크게 3가지다.

 

1) 서버 내 학습 요구량(연산) 증가 → AI 반도체 증가 & 메모리 반도체 증가

 

수많은 데이터를 기반으로 서버 내에서 AI는 학습이 진행된다. 인공지능 활용이 늘어난다는 것은 머신러닝, 딥러닝 등을 통한 인공지능의 학습이 증가한다는 것 을 의미하며 이는 연산 처리량의 증가를 말한다. 연산 처리량의 증가는 AI 반도 체의 증가를 야기하며, 현재 AI 반도체로는 GPU가 대표적으로 사용되고 있다. GPU의 경우만 봐도, DRAM 등 캐시 데이터를 저장할 메모리가 필요하다. 따라 서 비메모리와 메모리 모두 수혜가 발생한다.

 

2) Edge Device 내 연산 증가 → AI 반도체 증가 & 메모리 반도체 증가

 

서버 내에서 AI가 학습을 진행하기 위해 필요한 데이터는 AR/VR 기기, 자동차 등 하드웨어 디바이스를 통해 수집된다. 데이터 수집 과정에서 Edge Device는 각 데이터에 대해 정의와 분류 등의 과정을 거친다. 고해상도, 고사양 이미지 등의 데이터가 증가할수록 하드웨어에서 진행되는 연산 처리량은 증가한다. 이는 AI 반도체와 메모리 반도체의 증가를 야기한다.

 

 

 

3) 서버 트래픽 증가 → 서버 증설에 따른 메모리 반도체 증가

 

Edge Device에서 수집된 데이터가 인공지능 서버로 전달되고, 서버 내에서 학습 및 해석 후 해당 데이터는 다시 전방 하드웨어로 전달된다. 여기서 트래픽이 발 생한다. 서버 업체들은 이러한 데이터 트래픽의 최대치를 감안해 서버 증설을 사 전에 준비한다. 인공지능의 활용도가 높아질수록 서버 트래픽 증가 → 서버 투자 증가 → 서버용 DRAM, NAND 수요 증가로 이어질 수 있다.

 

 

 

1. 인공지능 - Chat GPT

 

Open AI에서 개발한 Chat GPT 출시 이후 AI, 인공지능에 대한 관심이 증폭됐다. GPT는 Generative Pre-trained Transformer의 약자로, Chat GPT는 사전에 언어 구조에 대한 학습이 진행된 인공지능 언어 모델이 사용자의 질문에 맞는 답변을 제공해주는 일종의 챗봇 형태의 서비스다.

 

 비메모리 영향 

 

방대한 양의 데이터를 빠르게 처리하는 것이 중요한 만큼, GPU의 필요성이 부각 되고 있다. CPU는 직렬 구조의 연산처리를 하기 때문에 순차적 작업이 가능한 반면, GPU는 병렬 구조의 연산처리가 가능해 동시에 빠른 연산 작업을 하기 유 리하다. 방대한 양을 학습해야 하는 인공지능에 GPU가 채택되는 이유다. Chat GPT의 경우 10,000개 이상의 엔비디아 GPU가 학습을 위해 사용되고 있는 것으로 파악된다.

 

 

Chat GPT는 서버 내에서 인공지능의 학습이 진행된다. 사용자들이 대화를 입력 하는 PC는 Edge Device에 해당되지 않는다. PC는 매개체의 역할만 할 뿐, 사용 자들이 네트워크를 통해 Chat GPT의 본사 서버와 직접 소통하는 구조다.

 

 

 메모리 영향 

 

GPU에는 연산 데이터를 저장할 공간이 존재하며, 이를 위해 DRAM이 탑재된다. 엔비디아 GPU에 탑재되는 DRAM은 SK하이닉스가 생산하는 HBM3 제품 이다. ChatGPT의 사용량 증가가 만들어낼 서버 증설 자극은 급격한 기울기가 되기에는 제한적일 것으로 예상된다.

 

 

 

 

2. AR/VR

 

AR은 Augmented Reality(증강 현실)의 약자로, 실제 현실에 가상 현실을 겹쳐 보여주는 기술을 의미한다. 대표적인 AR기기는 구글과 애플이 준비하고 있는 AR글라스다. 차량 내 디스플레이에 헤드업 디스플레이가 운전 정보를 나타내 주 는 것과 같이, 향후에는 AR글라스도 안경을 통해 여러 정보 확인 등과 같은 기 능이 구현될 것으로 예상된다. 스마트폰의 기능도 수행하면서 스마트폰을 대체하는 아이템이 될 수 있는 가능성도 제기된다.

VR은 Virtual Reality(가상 현실)의 약자로, 가상의 현실을 구현해 보여주는 기술 을 말한다. 대표적인 VR기기는 오큘러스 등이다. VR기기를 통해 착용자는 가상 현실 안에서 실제 현실처럼 행동하고 경험할 수 있다.

 

 

 비메모리 영향

 

AR/VR 기기의 경우, 가속도계, 지자기 센서 등 다양한 센서가 장착된다. 센서를 통해 방대한 데이터를 수집 및 처리하는 과정에서 복잡한 연산 처리가 필요하다. 더불어 해당 데이터를 중앙 서버로 전달하면, 인공지능은 학습과 동시에 솔루션을 다시 기기(Edge Device)로 전달해 증강 현실을 구현한다. Edge Device, 서버 내에서 각각 복잡한 연산 처리가 진행되고 이는 고해상도로 기술 발전이 될수록 심화된다. AR/VR 기기와 서버 각각 AI 반도체가 필요하다.

 

 메모리 영향

 

AR 기기와 서버 내에 AI 반도체가 탑재될 때 DRAM도 동반된다. 또한 AR 기기를 통해 데이터가 수집되면, 서버로 전달 전까지 기기 내에 데이터를 저장할 공간이 필요하다. 스토리지를 위한 NAND 역시 탑재된다.

 

 

 

 

3. 자율주행

 

현재의 자율주행은 AR/VR 기기와 마찬가지로 Edge Device-서버의 구조로 구현 된다. 자율주행 차량이 카메라, 센서 등을 통해 기록한 도로, 주행 등의 데이터를 인공지능 서버에 전달하면, 서버에서 이를 분석하고 다시 자율주행 차량에 솔루 션을 전달 및 구현시킨다. 따라서 Edge Device(자율주행 차량)와 서버 둘 다 인 공지능이 존재한다.

 

 

각 자율주행 업체별 방향성은 차이가 있다. 테슬라는 센서가 아닌 카메라 위주로 데이터를 수집할 계획이며, 테슬라 외 나머지 업체들은 센서(레이더, 라이다) 위 주로 데이터를 수집하는 것을 목표한다. 방식에 따라 반도체에 미치는 영향은 다 소 차이가 있을 것으로 예상된다.

 

 

 비메모리 영향

 

카메라와 센서를 통해 수집되는 데이터를 인공지능은 자체적으로 하나의 이미지 지도로 만든다. 그렇기에 카메라나 센서 등이 늘어나며 더 많은, 고해상도의 정보가 늘어날수록 차량 내 인공지능의 성능도 고사양화가 필요하다. 고스펙 AI 반 도체가 쓰이게 되는 이유다.

 

이론적으로는 테슬라처럼 카메라를 사용하는 것보다 테슬라 외 업체들처럼 카메 라와 더불어 센서를 많이 사용할수록 처리해야 하는 데이터 연산이 복잡해진다. 그러나 이와 무관하게 테슬라가 사용하는 AI 반도체의 개발 수준이 워낙 높아, 이를 구현하기 위한 메모리 반도체의 용량 증가 효과는 여타 업체들과 동일하게 발생할 것으로 예상된다.

 

 

 메모리 영향

 

고성능 AI 반도체가 쓰일수록 이를 빠르게 지원할 수 있는 메모리가 필요하다. AI 반도체의 고성능화는 메모리의 고용량화를 야기할 전망이다. AI 반도체에 맞춰 DRAM이 탑재되고, 차량에서 수집한 데이터를 서버로 전달하기 전까지 저장 할 공간을 위해 NAND 역시 탑재된다.

 

 

 

 

4. 시사점

 

4.1. 신규 수요는 분명, 그러나 일부는 이중수요가 될 가능성도 존재

 

앞서 정리한 사례들을 종합해보면, 신규 수요처들의 반도체 수요 창출 능력은 시장에서 기대하는 모습에 부합할 것으로 예상된다. 인공지능을 활용하는 과정에서 비메모리는 새로운 변화, 메모리는 용량 증가가 나타난다. 수집과 학습하는 데이터가 해상도가 높아지고 복잡도가 심화될수록 AI 반도체의 성능 개선이 필요하고, AI 반도체를 지원하기 위해 메모리 용량 증가가 기반으로 마련돼야 한다.

 

다만 이중수요(Carnivalization)가 발생될 가능성도 존재한다. 과거 스마트폰이 출시됐을 때, 당초 기대와 달리 메모리보다 비메모리에서 변화가 부각됐다. 스마트폰이 일부 PC 수요를 대체하면서 메모리의 신규 시장이 만들어지는 것보다 기존 PC향 메모리 수요의 일부를 차지하는 구조가 됐다. AR은 향후 동일한 사례에 해당할 가능성이 일부 있다. 자율주행과 VR은 상대적으로 해당 우려에서 자유로운 응용처라고 판단된다.

 

지금까지 정리한 신규 수요처들 모두 비메모리와 메모리 가릴 것 없이 수요 확대가 기대되는 요인이다. 그러나 일부 이중수요가 발생할 수 있는 응용처들도 존재하는 만큼 메모리 대비 비메모리에서 변화가 클 수밖에 없다고 판단된다.

 

 

 

4.2. AI 반도체 부상, 새로운 Value-Chain 형성 및 산업 재편 가능성

 

AI가 적용되고 있는 응용처에서 AI에게 요구되는 역할 요약하면 학습과 추론이 다. AI가 학습과 추론을 하는 과정에서 높은 연산 처리 능력이 필요하다. 따라서 AI 반도체는 고연산 처리가 가능한 반도체가 적합하다.

 

현재 AI 반도체는 GPU가 대부분을 차지하고 있다. CPU 대비 GPU는 데이터의 병렬 처리가 가능하다. 그러나 사실 GPU는 AI 반도체로 완벽하게 적합하지 않다. AI 반도체로 쓰기 불필요한 기능까지 탑재한 GPU는 낭비되는 전력이 많다.

 

전력효율성이 떨어지기 때문에 방대한 양의 데이터를 처리하는 과정에서 열이 많이 발생할 수 있고 이는 반도체 수명 단축으로 이어진다. GPU의 경우 기대 수 명은 2~4년인데, 자율주행과 같이 생명과 직결된 적용처에서는 10년 이상의 기 대 수명이 요구된다는 점에서도 부적합하다. 또한 음성이나 텍스트 등을 처리할 때 효율도 떨어진다. 전용 AI 반도체가 필요하다. 현 시점에서의 대안은 NPU다.

 

NPU는 처음부터 AI 반도체 목적으로 만들어진 반도체로 인간의 신경계를 모방해서 만들었다. 고연산이 필요한 일부 분야들에서는 이미 채택됐다. 스마트폰 내의 생체인식 기술, 카메라 등이 해당된다. 그러나 이러한 장점에도 불구하고 아직 AI 관련 응용처들에서는 GPU가 대부분 사용되고 있다. 배경은 1) 경제성과 2) 호환성(소프트웨어 지원 부족)에 있다.

 

1) NPU는 ASIC 반도체다. ASIC는 Application Specific Integrated Circuit의 약자로 특정 용도만을 위해 설계되는 주문형 반도체를 말한다. 고객사의 하드웨어 전용으로 설계되기 때문에 범용성이 떨어진다. 가격이 높을 수밖에 없다. 개발 초기 단계라 여전히 제조 및 생산 비용이 높다는 점도 작용한다.

 

2) NPU를 개발하기 위해 필요한 소프트웨어가 현재 거의 없다. ChatGPT가 엔비 디아의 GPU로 개발된 이유도 엔비디아의 cuDNN이라는 개발 플랫폼이 있기 때문이었다.

 

 

향후에는 결국 NPU가 GPU를 대체하는 AI 반도체로 사용될 가능성이 높다고 판단된다. NPU 보급률이 낮은 배경이었던 경제성은 지금보다 범용성이 높아질 지 여부가 중요하다.

 

인텔을 비롯한 NPU를 개발하고 있는 IDM, 팹리스들은 범 용성을 높이는 방향으로 준비 중이다. 더불어 삼성전자, 퀄컴, 구글과 같은 대형 업체들은 개발 플랫폼도 함께 준비하고 있는 만큼 향후 범용성 확대와 함께 AI 반도체 시장에서 NPU가 중심 제품으로 자리할 가능성이 있다고 판단된다.

 

흥미로운 점은 엔비디아는 NPU 제품에 대한 개발 계획은 존재하지 않는다는 것이다. NPU 개발 대신 기존 GPU 내에 Tensor Core 라는 하드웨어 유닛을 추가해 AI의 학습 및 추론 기능을 추가했다. 현재 AI 응용처에서 사용되고 있는 엔비 디아의 GPU가 이러한 형태다.

 

기존에 압도적으로 점유하고 있는 GPU 영역을 포기할 수 없다는 점에서 GPU의 기능 확장을 목표하고 있다고 생각된다. 그러나 여전히 AI 기능을 보완한 GPU도 완벽하게 적합하지 않다는 점에서 향후 NPU 시장 개화시 현재의 입지가 달라질 수 있는 가능성이 있다.

 

실제 아예 개발 계획이 없는 것인지, 혹은 내부적으로 준비하고 있음에도 외부에 알리지 않아서인지는 모르겠으나 엔비디아가 NPU 개발 계획이 없는 것이라면 이는 NPU 시장의 자리매김 과정에서 새로운 Value-Chain 형성과 함께 산업 재 편이 발생할 수 있음을 시사한다. 과거 스마트폰 개화 과정에서 인텔이 모바일 AP 시장 대응이 늦어지며 시장 진입에 실패한 것과 같은 양상이 보여질 수 있다.

 

 

 

4.3. 서버 수요의 확대는 단기적으로 불분명

 

AI 응용처의 본격화는 서버 증설을 자극하는 요인이다. 딥러닝, 머신러닝을 통해 많은 양의 데이터를 서버 내에서 학습 및 해석해야한다. 이 때 트래픽이 발생하 고 서버 증설 필요성이 생긴다. 중장기적으로 관련 수요가 점진적 우상향 할 수 있다. 그러나 단기적으로 급격한 수요 확대는 제한적일 수 있다.

 

이미 서버 업체 들은 코로나19 등 급격한 트래픽 증가까지 감안해 두었기 때문이다. 연산 처리량 증가로 인한 AI 반도체의 고사양화 과정에서, 고용량 메모리 수요 확대는 분명하다. 그러나 서버 측면에서는 단기적으로 다른 양상을 보일 수 있다고 판단된다.

 

 

 

 

 

출처: 신한투자증권, FourweekMBA, NVIDIA, 각 사 종합, 언론 보도, Technical University of Munich, Wiley, Qualcomm, Meta

 

뜨리스땅

 

 

 

https://tristanchoi.tistory.com/404

 

반도체 기술 탐구: AI 수요로 반도체 신성장 동력 장착

1. AI 반도체 적용 확대 → 비메모리 반도체 Q 증가 AI 반도체 적용처가 증가하고 있다. 차량용 반도체의 경우 비전 이외에 자연어 처리 등으로 AI 적용 처리도 늘어날 수 밖에 없다. 또한 드론, 스

tristanchoi.tistory.com

 

 

 

https://www.youtube.com/watch?v=it3_G6x77vU 

 

 

 

 

 

728x90
반응형

댓글