1. CXL이란?
CXL(Compute Express Link)은 CPU(중앙처리장치), 메모리 확장 모듈, 가속기(GPU·FPGA 등)를 고속·저지연으로 연결해주는 차세대 인터커넥트(연결 규격) 기술이다. PCI Express(PCIe) 기반의 물리적 인터페이스를 활용하면서 캐시 일관성(메모리 코히어런시)을 유지해 여러 장치가 시스템 메모리를 효율적으로 공유·확장할 수 있게 설계된 오픈 표준이라고 할 수 있다.

1.1. 주요 특징
- 고속·저지연 CPU-장치 연결: CXL은 CPU와 장치(가속기, 메모리 등)를 직접 연결해 데이터 이동을 빠르고 효율적으로 처리
- 메모리 일관성 유지: CPU와 여러 장치가 각각의 메모리 공간을 동기화하여 데이터 복제나 관리 복잡성을 줄임
- 유연한 메모리 확장·풀링: 기존 서버의 DIMM 슬록 한계를 벗어나 대용량·고대역폭 메모리 확장이 가능하며, 여러 서버·호스트에서 메모리 풀링(공유) 체계를 쉽게 구현할 수 있음
- 오픈 표준: 인텔, AMD, 삼성, 마이크론 등 주요 반도체 기업들이 공동 개발 및 지원하여 생태계가 빠르게 성장 중

1.2. CXL 기술의 장점
- 메모리 확장성: 서버별 단일 메모리 용량 한계 극복. 수 TB 이상 확장 및 추가 메모리 모듈을 외장 카드처럼 손쉽게 장착·효율적 사용 가능
- 저지연/고대역폭: 기존 PCIe 대비 수십~백 배 높은 대역폭(PCIe5·6 활용, 최대 128GB/s), DRAM 수준의 저지연 연결
- 메모리 풀·공유: 다수 서버 및 장치가 메모리 풀(공유창고)을 활용해 메모리 자원 이용 효율과 서버 활용도를 높임
- 리소스 할당의 유연성: 워크로드별로 필요한 메모리·가속기 자원을 동적으로 할당·회수할 수 있어 TCO(총소유비용) 절감
- 소프트웨어 개발 편의성: 메모리 일관성 제공, 데이터 복사·동기화 부담 감소
- 빠른 CPU-GPU-FPGA 통신: 다양한 가속기가 CPU메모리 및 자체 메모리 자원을 자유롭게 읽고 쓸 수 있음.

1.3. CXL 기술의 단점
- 최고속 대역폭 한계: GPU-GPU, 딥러닝 대형 모델 등 극한의 대역폭 요구에는 NVLink, UALink 등 특화 인터커넥트에 비해 속도 저하될 수 있음
- 최초 도입 비용: 신규 CXL 메모리, 스위치, CPU 지원 서버 도입에 초기 비용 증가. 시장 대중화 전까지 신규 투자 필요
- 플랫폼 호환성: 최신 CPU·플랫폼에서만 지원, 구형 서버 및 장치와 호환 제한
- 소프트웨어 적응 필요: OS, 미들웨어, 앱이 CXL 환경에 최적화되는 데 추가 개발·적응 기간 소요

2. 국내 기업들의 CXL 생태계에서의 역할
국내 기업들은 CXL 글로벌 표준 작업에 실질적으로 참여하고, D램·컨트롤러·스위치·PHY 등 핵심 IP 라이선스 개발과 공급을 통해, CXL 생태계의 핵심 기술 및 상호운용성 확장, 글로벌 시장 진출에 중요한 역할을 수행하고 있다. 특히 오픈엣지, 파두, 파네시아, 퀄리타스반도체 등이 앞장서며, 표준/IP 영역의 독자적 경쟁력을 확보하는 중이다.
2.1. 메모리·소자 대기업: 삼성전자, SK하이닉스
- 역할:
글로벌 메모리 시장 선도, CXL 기반 D램 및 메모리 모듈 개발
데이터센터·AI 서버용 차세대 고속·저지연 CXL DRAM 제품 양산
자체 CXL 컨트롤러, 모듈 솔루션 제공, 생태계 표준화 주도
- 사업모델:
메모리칩 공급, CXL 메모리 솔루션 완제품 판매
고객·플랫폼별 맞춤 인증 및 연동 지원
2.2. 검사·장비 전문기업: 엑시콘, 네오셈
- 역할:
CXL 기반 DRAM/SSD 등 메모리 및 시스템 검사장비 개발·제조
최신 CXL 프로토콜(2.0/3.0 등) 테스터 장비 상용화로 공급 확대
대형 메모리 기업(삼성, SK 등) 및 서버 제조사 대상 장비 납품
- 사업모델:
반도체 검사장비 판매 및 유지보수
신제품(차세대 CXL 테스터) 개발로 매출 다각화 및 성장 추구
2.3. 소재·부품·PCB 업체: 티엘비, 코리아써키트 등
- 역할:
CXL 메모리 모듈/서버용 고속 인쇄회로기판(PCB) 설계·생산
차세대 DDR5·CXL D램용 PCB 독자개발 및 대량 생산체계 구축
국내외 메모리 업체, 서버 ODM 기업에 납품
- 사업모델:
핵심 부품 단품 공급(PCB 등), 기술 국산화로 개발 격차 확보
단가 상승 효과 기반 수익성 개선, AI 서버/데이터센터용 신시장 개척
2.4. 팹리스·IP·스위치·컨트롤러 개발사: 파두, 실리콘믹스, 엑시나 등
- 역할:
CXL 메모리 컨트롤러, 스위치 칩 및 IP(설계자산) 개발
글로벌 팹리스(반도체 설계 기업)로서 해외 대형 고객과 라이선스·공동 개발
AI 특화 CXL 네트워크 반도체, 메모리/가속기 최적화 솔루션 제공
- 사업모델:
IP/반도체 설계 라이선스, 칩 실장 및 모듈·시스템 판매
해외 기업 협력(공동 R&D, 기술 제휴), 고객 맞춤형 컨트롤러·스위치 상품화
파두·이음(PaDoo·Eeum)
국내 팹리스 대표로, CXL 표준스위치 칩 및 관련 IP 개발에 집중. 글로벌(미국 실리콘밸리)에 연구소를 설립해 상호운용성 검증·시뮬레이션 등 실제 표준 작업에 직접 참여함
오픈엣지테크놀로지
국내 유일 CXL 컨소시엄 등록 IP 업체. CXL 3.0의 핵심인 컨트롤러 IP와 DDR PHY IP를 개발 완료해, 실제 메모리칩·D램 모듈 기업과의 라이선스 협력을 확대 중임. 인텔·삼성·SK하이닉스 등과 기술 협업을 통해 컨트롤러 IP의 글로벌 라이선스를 추진하고 있습니다.
파네시아(Panecia)
세계 최초로 CXL 3.0 IP를 개발, AI 가속기 등 CXL 기반 시스템의 하드웨어·소프트웨어 IP를 공급. IP 라이선스 확장을 바탕으로 CES 등 국제 박람회에서 혁신상 수상.
퀄리타스반도체
국내 최초 PCIe6.0 물리계층(PHY) IP와 CXL 3.0 연동 기술 상용화. 미국 외국 IP 전문기업과 직접 계약을 체결하며 글로벌 시장에서 기술력을 인정받았음
3. 국내 CXL 전문 스타트업들은 생존 가능성
3.1. 삼성전자와 SK하이닉스의 전략 차이
삼성전자는 CXL 핵심 제품(모듈, D램, 컨트롤러 등) 부문에서 고도의 내재화 비중을 유지하고 일부 표준·상호운용 요구에서만 외부 IP를 제한적으로 활용하고 있다. 그에 반해, SK하이닉스는 제품 초기 외부 IP 비중이 높았으나, 2025년 기준 내재화, 자체 칩 설계로 빠르게 전환 중이다.
외부 IP 의존은 초기 단계에서 일부 있었으나, 2025년 현재 삼성과 SK하이닉스 모두 CXL 제품 핵심 영역에서 내재화 비중이 절대적으로 높아지고 있으며, 장기적으로 독자 설계·공급 체계로 전환 중임이 특징이라고 할 수 있다.


3.2. 두 대기업들의 내재화 추진으로 인한 영향
- 시장 장악력 강화: 두 거대기업이 핵심 컨트롤러, DDR PHY, 스위치 등 CXL IP를 자체 개발·적용함으로써, 토종 팹리스·IP 업체들과의 ‘공급사슬 종속성’이 줄어들고 경쟁이 매우 치열해질 것으로 전망된다.
- 표준화와 생태계 변화: 대기업 주도의 표준 수립·검증으로 시장 진입 허들은 높아지고, 외부 업체의 영향력은 제한될 수 있다.
- 외부 IP 수요 감소: 컨트롤러 등 핵심 IP에 대한 외부 의존도가 점차 줄면서 기존 IP 개발사에 당장 공급처 감소라는 부담이 생길 수 있다.
3.3. 중소기업·스타트업의 생존·성장 전략
- 차별화·특화 기술:
삼성·SK가 내재화하더라도 AI 엣지, 특수 메모리·가속기, 네트워크 최적화 등 특화 영역은 직접 개발/공급보다 외부 혁신업체 협력에 의존하는 경향이 있다. 예를 들어, 저전력 특화, 저지연 스위치칩 디자인, IP 코어의 커스터마이징 등 한정적 분야에서는 중소기업이 독자적 입지를 구축할 수 있다.
- 글로벌 시장 및 협력 네트워크:
미국·유럽 등 글로벌 반도체·팹리스와의 IP 라이선스/공동 개발, 국제 표준화 협의체 적극 참여, 그리고 대기업과의 협력(공동 R&D, ODM/설계 협력 등)을 통해 사업모델을 다각화할 수 있다.
- OS·관리 SW·도구 개발:
하드웨어 IP 외에, CXL 환경을 위한 소프트웨어·관리 툴, 최적화 미들웨어, AI 워크로드용 CXL 플랫폼 등 다양한 분야에서 진입 기회가 열려 있다.
- R&D 및 특허:
독자 특허·원천기술 확보, 혁신적 테스트베드 개발, 소프트웨어-하드웨어 융합 모델의 개발 역량 강화등이 필요하다.
4. NVIDIA의 NVLink와의 관계
CXL과 NVLink는 모두 고성능 컴퓨팅 인프라, 특히 데이터센터와 AI 서버에 사용되는 차세대 인터커넥트 기술이다. 하지만 이 두 기술은 서로 대체재라기보다는 역할이 다른 보완재에 가깝다.
두 기술 모두 고속 연결·데이터 처리라는 목적은 같지만 표적 시장과 최적화된 용도, 지원 범위는 다소 차이가 있다.
NVLink가 GPU 군 집(클러스터) 내부 통신에 초점을 맞춘 반면, CXL은 "CPU-가속기-메모리-스토리지" 간 전체적인 데이터센터 자원 통합·확장에 초점을 두고 있다.
최신 AI 인프라에서는 GPU 클러스터 내부에는 NVLink, 서버·메모리 풀·가속기 전체 통합에는 CXL을 동시에 도입하는 하이브리드 설계가 점점 늘어나고 있다.

하지만, AI 인프라를 주도하는 NVIDIA DGX 서버(특히 H100/B300 등 최신 모델)는 기본적으로 GPU 간에 초고속 통신을 위해 NVLink 및 NVSwitch를 중심으로 설계되어 있고, 서버 내에서 CPU와 GPU 간의 연결은 대부분 PCI Express(PCIe)를 사용하고, CPU·GPU 간 메모리 공유는 NVLink가 주요 역할을 담당하는 형태로 설계해서 CXL의 사용은 매우 제한적이다.

NVLink vs CXL
| 항목 | NVLink | CXL |
| 연결 구조 | GPU↔GPU 직접 메시 | 호스트↔장치(메모리/가속기) |
| 대역폭 | 최대900GB/s (H100 기준) | 수십~수백GB/s (PCIe기반) |
| 지연시간 | 마이크로초 미만 | CXL 2.x~3.x: 데이터 경합시 수~수십 마이크로초 |
| 활용 아키텍처 | 다중 GPU 클러스터, AI훈련/HPC | CPU-메모리 풀링, 이기종 자원 연결 |
| 변조 방식 | PAM4(고효율), 직접 하드웨어 | NRZ, 스위치/버퍼 거침 |
5. NVIDIA가 CXL 표준 채택을 미룬 이유
NVIDIA는 데이터센터와 AI 서버 시장에서 자체 NVLink 인터커넥트 기술을 활용함으써, CXL 표준 도입을 상대적으로 지연시키고 있다고 할수있다. 그 배경에는 아래와 같은 요인이 존재한다.
5.1. NVLink의 확장성 및 대역폭 우위
NVLink는 GPU 간, GPU-CPU간 고속 연결에 특화되어 있고, GPU와 GPU 간 직접 통신(Direct Communication)을 지원한다. CPU를 거치지 않고, GPU끼리 바로 데이터 교환이 가능해 라운드트립 지연이 현저히 줄어든다. 최신 NVLink는 최대 900GB/s 이상의 대역폭을 제공하며, 이러한 프로토콜 설계 자체가 마이크로초 수준의 초저지연 통신에 최적화되어 있다.
AI 가속기 클러스터(수십~수천 GPU)의 경우, 메모리 영역·확장성·병렬처리 관점에서 CPU 기반 메모리 확장보다 더 넓은 도메인을 필요로 하며, NVLink는 이미 이 목적에 특화된 황금 표준에 가까운 효율을 갖추고 있다.
NVLink는 다수의 GPU를 메쉬 네트워크로 상호 연결해, 통신 경로가 최적화되어 여러 GPU가 동시에 낮은 지연으로 데이터 교환을 할 수 있습니다. 반면, CXL은 주로 PCIe 패브릭 및 하위 호환성을 중시하면서, 스위치·컨트롤러·버퍼 거쳐서 통신이 이루어져 상대적으로 지연이 누적되기 쉽다.
NVLink의 프로토콜은 메모리 일관성 유지와 오류 정정(ECC 포함), 그리고 데이터 복사 최소화를 하드웨어 수준에서 통합을 한다. 특정 캐시 관리·메시지 플로우·버퍼링 과정을 단축시켜 소프트웨어적 오버헤드가 거의 없다
5.2. CXL의 성능 및 완성도 한계
CXL 프로토콜은 CPU/메모리/가속기 간의 통합 연결 및 자원 풀링에 유리하나, GPU 내부 로컬 DRAM 또는 HBM 직접 연결보다는 속도·지연 측면에서 불리한 것이 사실이다.
현행 CXL(특히 1.1~3.1)은 빠르게 발전 중이지만, 하드웨어·소프트웨어 간 표준 완성도와 상호운용성, 리눅스 기반 지원 등에서 여전히 일부 실험적·초기 단계이다.
고성능 AI 모델 추론·학습에는, GPU 로컬메모리 준하는 읽기/쓰기 성능이 필수인데 CXL은 아직 NVLink만큼의 실시간 성능을 보장하기 어렵다.
5.3. 독자 생태계 및 시장 차별화 전략
NVIDIA는 NVLink/NVSwitch 기반 클러스터의 독자 기술·생태계를 구축해, 고가의 GPU 서버 시장에서 경쟁사와 차별화된 프리미엄 브랜드를 유지할 수 있었다.
CXL 표준은 여러 업체의 개방적 참여와 상호운용성을 중시(AMD, 인텔, 삼성, 글로벌 메모리/가속기업들이 포함)하나, NVIDIA는 자체 기술로 성능과 시장 장악력을 우선시했고, 현재 그러한 상황으로 되어있다.
5.4. 기술 전환의 시기·비용
CXL은 PCIe 패브릭 기반으로, 대규모 도입엔 하드웨어와 소프트웨어 모두 교체·적응이 필요하고, 복잡성 및 전력소모 관련 비용 부담도 존재한다.
NVLink를 대체·병행하려면 충분한 검증, 제품 최적화 및 생태계 전환 기간이 필요해, NVIDIA는 실질적인 상품 경쟁력이 완성될 때까지 CXL의 주력 채택을 유보하고 있는 것으로 보인다.
6. 그외 CXL이 생각보다 빨리 확산되지 않는 이유
6.1. 리더들(인텔, 삼성)의 부진
반도체 업계에서는 CXL 시장 지연 이유로 삼성전자와 인텔의 부진을 지목하고 있다. 업계 관계자는 “최근에 CXL 관련된 이야기가 쏙 들어갔다”며 “기존 시장 리더였던 삼성전자와 인텔 부진 영향”이라고 분석했다.
특히 인텔의 부진이 뼈아프다. 인텔은 CXL 컨소시엄 이사회 멤버로, CXL 지원 CPU를 양산한다. 인텔이 프로세서를 출시해야 메모리 역시 판매할 수 있다. 문제는 인텔의 차세대 서버용 CPU인 '다이아몬드 래피즈' 출시가 지연될 가능성이 제기된다는 점이다.

이 프로세서는 올해 하반기 출시가 예정됐으나, 인텔 내부 대규모 인력 구조조정 등으로 인해 일정이 밀릴 수 있다는 분석이 나온다.
다이아몬드 래피즈는 CXL 3.0을 지원하는 최초의 프로세서다. CXL 2.0이 단순히 CPU와 메모리 각 하나씩만 연결됐다면, CXL 3.0부터는 여러 개의 프로세서가 동시에 단일 메모리 풀에 접근할 수 있다. 쉽게 말해 CXL 2.0은 한 사람이 메모리라는 창고 하나를 혼자서 쓴다면, CXL 3.0은 여러 사람이 동시에 거대한 메모리 창고를 나눠 쓰는 방식이다. 게다가 CXL 3.0은 연결 통로도 훨씬 더 넓고 빠르다.
삼성전자의 경우 CXL 시장 개화를 기다리는 입장이다. CXL은 시장 특성상 프로세서 출시와 함께 메모리 시장도 함께 열린다. CXL 지원 메모리를 개발하더라도, 프로세서가 없다면 CXL을 이용할 수 없기 때문이다. 정명수 파네시아 대표는 “메모리가 CXL을 리드하기는 쉽지 않다”며 “시장을 열어줘야 메모리는 따라올 수 있다”고 설명했다.
6.2. 기회와 위기가 공존하는 CXL
삼성과 인텔 양사 입장에선 CXL 시장 개화에 따라 기회와 위기가 공존한다.
CXL이 도입될 경우 프로세서와 메모리의 판매량이 다소 감소할 것으로 보인다. 기본적으로 CXL의 콘셉트는 메모리와 프로세서를 더 효율적으로 사용하는 것이다. 메모리와 프로세서를 더 많이 판매해야 하는 양사 입장에선 악재인 셈이다.
다만 CXL 지원 칩이 고부가인 만큼 실적에는 호재로 작용할 수 있다. 현재 반도체 업계의 추세는 고부가 제품으로의 체질 개선이다. 업황을 덜 타며, 저가용 시장의 황소개구리인 중국 업체와 정면 대결을 피할 수 있기 때문이다.
한편 업계에서는 CXL의 본격적인 개화 시기를 내년 2026년으로 보고 있다.

6.3. 하드웨어-소프트웨어 생태계 미성숙
- 기술적 완성도 부족
CXL 2.0 장비의 상업적 규모 전환이 지연되고 있으며, 소프트웨어 최적화 부족으로 대규모 배포가 어려운 상황이다. 현재 대부분의 솔루션이 CXL 1.1 또는 CXL 2.0 기반으로 제한되어 있으며, CXL 2.0 대량 생산이 2025년에야 예상된다.

- 응용 프로그램 최적화 부족
CSP(클라우드 서비스 제공업체)들이 모든 고객 워크로드에 대한 응용 프로그램 성능 보장 없이는 CXL을 배포하지 않으려 한다. 그런데, CXL을 위한 소프트웨어의 경우 자동 계층화, 소프트웨어 정의 메모리 풀링 등 미들웨어 개발이 아직 충분하지 않다.
6.4. 성능 및 지연시간 한계
- 높은 지연시간 문제
CXL 메모리의 접근 지연시간(170-250ns)이 로컬 DRAM(80-140ns)보다 상당히 높다. 특히 CXL tail latency(꼬리 지연시간) 문제가 예측하기 어렵고, 지연에 민감한 애플리케이션에서는 성능 저하가 발생한다.
- 캐시 최적화 한계
하드웨어 프리페처(prefetcher)가 CXL로 인한 지연을 완화하는 데 비효과적이며, CXL 메모리 컨트롤러의 최적화 수준이 아직 기존 통합 메모리 컨트롤러만큼 성숙하지 않았다.

6.5. 경제적·인프라 전환 비용
브라운필드 데이터센터 업그레이드는 사실 부담스러운 일이다. 기존 데이터센터의 CXL 배포는 시간, 노력, 비용이 상당하며, 기술 교체 주기에 크게 의존하기 때문이다. 그린필드(신규) 데이터센터와 엔터프라이즈 서버에서만 제한적 배포가 이루어지고 있는 상황이다.

업계에서는 2026-2027년이 CXL의 실질적 채택 변곡점이 될 것으로 전망하고 있으며, CXL 3.0 기반 PCIe 6.0 솔루션의 상용화와 함께 본격적인 시장 확산을 기대하고 있다.
뜨리스땅
출처: Computerexpresslink, reddit, ABI research, zdnet, tech.gluesys, Kaist news, IT chosun, velog.io, The elec, 삼성전자 및 SK하이닉스 뉴스룸 등
https://tristanchoi.tistory.com/700
삼성파운드리의 테슬라 수주 배경과 의미
1. 계약 개요2025년 7월 28일, 삼성전자는 22조7,648억원(165억 달러) 규모의 대형 파운드리 계약을 체결했다고 공시했다. 이는 8년 이상의 장기 계약(2025.7.24~2033.12.31)으로 삼성전자 2024년 전체 매출액
tristanchoi.tistory.com
'반도체, 소.부.장.' 카테고리의 다른 글
| NVIDIA GPU 설계에서 SRAM 관련 주요 이슈들 (3) | 2025.08.19 |
|---|---|
| 삼성파운드리의 테슬라 수주 배경과 의미 (0) | 2025.08.16 |
| 애플이 삼성파운드리와 삼성의 이미지 센서를 선택한 이유 (10) | 2025.08.10 |
| 서버용 CPU 시장의 판도를 바꾸고 있는 AMD의 V-cache 기술 (0) | 2025.02.08 |
| 에코 시스템 구축을 통해 Blackwell GB200 시스템의 발열 해소를 위한 NVIDIA의 노력 (1) | 2025.01.20 |
댓글