현재까지 정보를 종합해 볼때 삼성전자의 HBM 엔비디아 공급 상황은 다음과 같이 정리할 수 있다.
1. HBM3 공급 상황:
삼성전자는 엔비디아에 HBM3까지는 공급하고 있는 것으로 보인다. 로이터 통신에 따르면, 삼성전자가 엔비디아에 HBM3를 납품하기 위한 퀄 테스트를 처음으로 통과했고, 이 HBM3는 엔비디아의 중국 시장용 저사양 칩인 H20 GPU에 사용될 예정이라고 한다.
지난 9월 3일 대만 시장조사기관 트렌드포스는 "삼성이 (SK하이닉스, 미국 마이크론에 비해) 다소 늦게 뛰어들었지만, 최근 HBM3E 인증을 완료하고 H200용 HBM3E 8단 제품의 출하를 시작했다"며 "블랙웰 시리즈에 대한 인증도 순조롭게 진행 중"이라고 밝혔다. 그러나, 이것은 양산제품은 아니고 테스트를 위한 제품 출하인 것으로 보인다.
선두주자인 SK하이닉스는 이미 지난 3월 HBM3E 8단을 양산해 엔비디아에 공급하기 시작했다. 마이크론도 지난 2월 HBM3E 8단 양산을 시작했고, 이를 엔비디아에 공급하겠다는 계획을 밝힌 바 있다.
H200은 HBM3E(8단)을 탑재한 엔비디아의 최신 그래픽처리장치(GPU)다. 트렌드포스는 지난달 초 H200의 출하로 올해 HBM3E 소비점유율이 60% 이상으로 높아질 것으로 전망하기도 했다.
트렌드포스는 "올해 엔비디아의 제품 라인업은 H200이 HBM3E 8단 메모리 스택을 탑재한 최초의 GPU로 큰 파장을 일으킬 예정"이라며 "곧 출시될 블랙웰 역시 HBM3E를 완전히 채택할 계획"이라고 설명했다.
앞서 로이터는 지난달 삼성전자가 엔비디아에 HBM3E(8단) 납품을 위한 퀄테스트를 통과했다고 보도한 바 있다. 이에 대해 삼성전자는 당시 "주요 고객들과 테스트를 진행 중"이라고 밝혀 보도를 사실상 부인했다.
하지만 삼성전자의 퀄테스트 통과가 이르면 9월 중일 것이라는 게 업계의 지배적인 시각이었다.
이와 관련, 삼성전자는 지난 7월 2분기 실적발표 후 콘퍼런스콜에서 HBM3E 8단 제품을 3분기 내 양산해 공급을 본격화하고, 12단 제품도 하반기에 공급할 예정이라고 밝힌 바 있다.
트렌드포스는 "최근 H200 GPU에 대한 클라우드서비스공급자(CSP)와 주문자 상표 부착 생산(OEM) 고객의 수요가 증가하고 있다"며 "H200은 올해 3분기 이후부터 엔비디아의 주요 출하 동력이 될 것"이라고 전망했다.
예상대로 HBM3E 8단 제품이 출하를 시작했을 경우 HBM3E 12단 제품의 퀄테스트 통과도 탄력을 받을 것으로 보인다.
트렌드포스에 따르면 엔비디아가 향후 선보일 블랙웰 울트라는 8개의 HBM3E 12단 스택을 탑재할 것으로 관측된다.
이에 따라 내년에 HBM3E에서 12단 제품 비중이 40%까지 증가하고 이보다 더 커질 가능성도 있다.
2. 향후 전망:
AI 기술 발전으로 고사양 HBM에 대한 필요성이 날이 갈수록 커지면서 시장의 관심은 HBM3보다는 차세대인 HBM3E에 집중되고 있다.
삼성전자는 HBM3E 8단 인증은 3분기, 12단 인증은 4분기 완료를 목표로 하는 것으로 알려졌다.
대만 시장조사기관 트렌드포스는 최근 "삼성의 공급망 파트너 중 일부는 최근 (HBM과 관련해) 가능한 한 빨리 주문하고 용량을 예약하라는 정보를 받은 것으로 알려졌다"며 "이는 HBM이 하반기에 원활하게 출하를 시작할 수 있다는 의미"라고 밝혔다.
이달 초에는 삼성전자가 HBM3E 12단 제품에 대한 PRA(양산준비승인)를 마쳤다는 소식이 전해진 바 있다. 다만 이는 양산을 위한 삼성전자 내부 기준을 충족한 단계로, 고객사 퀄 통과를 의미하는 것은 아니다.
HBM 수요가 폭증하면서 엔비디아 역시 SK하이닉스에만 기댈 수 없는 상황이라는 점도 삼성전자의 HBM3E 공급 임박 시각에 힘을 보태고 있다.
트렌드포스는 "오는 2025년까지 고급 AI에 대한 수요가 강세를 유지하는 가운데 엔비디아의 차세대 블랙웰이 시장의 주류로 부상할 것"이라며 "AI 서버 시장의 강력한 지속적인 수요로 전체 HBM 공급량은 2025년까지 두 배로 증가할 것"이라고 내다봤다.
HBM의 공급이 수요를 따라가지 못하는 상황이 되면서 가격 인상도 예상된다.
이처럼 가격 협상력과 수급 등을 고려하면 엔비디아도 삼성전자의 HBM 제품 공급이 절실한 상황이다.
삼성전자가 성공적으로 HBM3E를 양산해 엔비디아에 납품하게 되면 실적 상승의 모멘텀이 되는 것은 물론이고, 현재 SK하이닉스 중심인 HBM 시장의 판도가 바뀔 수도 있다.
트렌드포스에 따르면 지난해 전 세계 HBM 시장 점유율은 SK하이닉스가 53%로 1위였으며, 삼성전자가 38%로 뒤를 이었다.
업계 관계자는 "수요가 급증하는 만큼 얼마나 많은 물량을 생산해 고객의 요구를 소화할 수 있느냐가 관건"이라며 "삼성전자의 생산능력(캐파)이 SK하이닉스보다 더 큰 만큼 (삼성전자가) 엔비디아를 뚫으면 물량면에서 앞지를 수 있을 것"이라고 말했다.
3. 기술적 이슈는 무엇인가?
삼성전자의 HBM3E가 겪고 있는 문제는 발열과 소비 전력 이슈이다. 이에 대해 명확한 기술적 원인은 공개되지 않았지만. HBM 기술의 특성과 제공된 정보를 바탕으로 몇 가지 가능한 요인을 추론해볼 수 있다.
1) 적층 구조의 복잡성:
HBM3E는 8단 또는 12단으로 DRAM 칩을 수직으로 쌓는 구조를 가진다. 이러한 고밀도 적층 구조는 열 관리를 더욱 어렵게 만들 수 있다.
2) TSV(Through-Silicon Via) 기술
HBM은 수천 개의 TSV를 사용하여 적층된 칩들을 연결한다. 이 TSV들이 효율적으로 작동하지 않으면 전력 소비가 증가하고 열이 더 많이 발생할 수 있다.
3) 연결 범프:
HBM3E는 매우 높은 대역폭(초당 1.18TB)으로 작동한다. 이러한 고속 동작은 더 많은 전력을 소비하고 더 많은 열을 발생시킬 수 있다. 고속 동작을 위해 수천개의 TSV라는 입출력 통로가 수직으로 존재하며, 이 통로가 열 방출에 도움을 주기도 한다. TSV의 통로 내에는 구리로 채워지며, 구리 끝에는 다음 층과 접합하기 위해 솔더범프(납땜과 비슷)라는 물질과 구조가 존재한다. 이 범프에서도 열을 효과적으로 발산해줄 수 있어야 한다.
4) 패키징 기술:
SK하이닉스가 사용하는 MR-MUF(Mass Reflow Molded Underfill) 기술과 같은 고급 패키징 기술의 부재 또는 최적화 부족이 열 관리 문제를 야기할 수 있다. 삼성은 underfill을 위해 SK하이닉스가 사용하는 액상 소재가 아닌 film 형태의 소재를 사용하는 TC-NCF 기술을 사용하고 있다. SK하이닉스도 HBM2까지는 TC-NCF 기술을 사용했으나, 2019년에 HBM2E를 개발하면서 MR-MUF 기술로 전환하였다
SK하이닉스의 MR-MUF 기술은 침 적층 시 압력을 6% 줄이고, 열 발산을 45% 개선하는 효과가 있다고 한다.
5) 공정/설계 기술의 최적화:
삼성전자가 HBM 기술 개발에 상대적으로 늦게 참여했기 때문에, 공정 기술의 최적화가 충분히 이루어지지 않았을 가능성이 있다. 또한, 전력 효율성과 열 관리를 위한 회로 설계 최적화가 충분히 이루어지지 않았을 수 있다.
반면, SK하이닉스는 2013년 최초로 HBM 칩을 개발한 이후 약 10여년동안 HBM 기술 개발에 집중 투자해 왔으며, 최근에는 기존의 MR-MUF 기술을 개선한 Advanced MR-MUF 기술을 개발하여 열 발산 성능을 10% 개선했다.
6) 재료 선택:
사용된 재료의 열 전도성이나 전기적 특성이 최적화되지 않았을 가능성이 있다. 절연 및 물리적인 안정화를 위해 채우는 MR-MUF나 TC-NCF와 같은 underfill 물질은 기본적으로 접착성 물질의 폴리머 소재이나, 이 underfill 물질을 통해서 열 방출이 되어야 하기 때문에, 열방출에 효과적인 세라믹 소재의 particle을 포함하게 된다. 이 세라믹 소재는 대표적으로 알루미나, BeO, AlN,SiC, BN 등이 있다.
삼성전자는 이러한 문제들을 해결하기 위해 제품 최적화 과정을 진행 중이며, 고객사들과 긴밀히 협력하고 있다고 밝혔다. 정확한 원인과 해결 방안은 삼성전자의 추가적인 연구와 개발을 통해 밝혀질 것으로 보인다.
출처: 와우TV, SK하이닉스, 한겨레, 테크파워업, 비즈니스포스트, 톰스하드웨어, 로이터, 블로터닷넷, 매경, 연합뉴스
뜨리스땅
'반도체, 소.부.장.' 카테고리의 다른 글
반도체 기술 변화 짚어보기 - 2) GAAFET 채용의 본격화 (1) | 2024.09.15 |
---|---|
반도체 기술 변화 짚어보기 - 1) 미세공정이 가져오는 트랜지스터 구조의 변화 (0) | 2024.09.15 |
NVIDIA의 Blackwell 설계 결함 및 마스크 수정 이슈 (6) | 2024.09.12 |
CoWoS 공정에 대해 관심을 가져야 하는 이유는 무엇인가? (1) | 2024.09.11 |
AI 서버의 미래? 수냉식 vs. 공냉식 (0) | 2024.09.09 |
댓글