1. 기업 개요
리벨리온은 Kaist 및 MIT 출신인 박성현 대표가 2020년에 설립한 스타트업으로 AI반도체인 NPU를 설계하는 반도체 회사다. 반도체 제조 공정 중 설계만 하는 fabless로 반도체 제조는 삼성파운드리에서 진행하고 있다.
리벨리온이 속한 시장은 넓게 보면 비 메모리 반도체인 ASIC이지만, 그 중에서도 최근에 각광받고 있는 AI 모델을 운영할 수 있는 NPU 제품 시장에 집중하는 기업이다.
리벨리온은 올해 1월에 1,650억원의 Series B 펀딩을 close 하면서 누적 투자금액은 2,800억이 되었고, 기업가치 8,800억원을 인정받게 되어, 명실상부 국내 AI반도체 스타트업의 선두 기업으로 자리매김하게 되었다.
글로벌 경쟁사로는 엔비디아(NVIDIA)와 AMD, Qualcomm 등이 있고, 국내 경쟁사로는 유사한 스타트업으로 퓨리오사AI, 사피온이 있다. 리벨리온의 반도체를 만들어주는 삼성전자의 경우도, 삼성전자 내 삼성파운드리 사업부는 리벨리온과 협업하는 관계에 있지만, 엑시노스와 같은 AP를 만드는 시스템LSI 사업부는 잠재적인 경쟁사라고 할 수 있다.
특히, 최근 주주총회에서 경계현 삼성전자 사장이 네이버와 함께 AI반도체인 '마하-1'의 개발 사실을 공개하면서, 그러한 움직임을 가시화하고 있다. 물론 아직은 프로토타입 제품인 FPGA 형태의 제품이지만, 삼성전자의 전략에 따라 얼마든지 양산제품을 추가 개발 및 제품화될 수 있다.
2. 주요 제품
리벨리온은 창업한지 만 4년이 되지 않았지만, 2개의 제품을 출시하였다. HFT(High Frequency Trading)라 불리는 초고속 trading 시스템에 사용되는 Ion이라는 제품과 생성형 AI 솔루션을 운영할 수 있는 Atom이라는 제품이다. 4년만에 2개의 제품을 출시하는 것은 쉬운 일이 아니기 때문에, 리벨리온의 기술력과 팀의 역량이 상당한 수준임을 짐작할 수 있다.
현재 주력 제품은 Atom이라고 할 수 있으며, 작년에 시제품이 출시되었고, 올해 양산 제품이 출시된다.
삼성전자 파운드리(반도체 위탁생산) 5나노(㎚·1나노미터=10억분의 1m) 극자외선(EUV) 공정을 활용한 데이터센터용 AI(인공지능) 칩으로 올해 양산될 예정이며, 삼성전자(005930)의 디자인솔루션파트너(DSP) 중 하나인 세미파이브와 삼성 5나노 AI 반도체 'ATOM(아톰)'의 작년 11월에 양산 계약을 완료했다.
아톰은 업계 최고 수준의 그래픽처리장치(GPU) 성능과 동급 신경망처리장치(NPU) 대비 최대 3.4배 이상 에너지 효율을 보이는 것으로 알려졌으며, 128TOPS(1초 당 128조번의 정수 연산) 및 32TFLOPS(1초 당 32조번의 부동소수점 연산)의 성능을 갖췄다. 지난해 시행한 반도체 벤치마크인 'MLPerf 3.0'에서는 엔비디아의 추론용 AI 반도체 대비 1.4~2배 빠른(언어모델 BERT-Large 기준) 속도를 입증하기도 했다.
앞서 리벨리온은 작년 초 삼성 파운드리에서 한 장의 웨이퍼에 다양한 종류의 반도체를 찍어내는 'MPW(멀티프로젝트웨이퍼) 서비스'를 통해 아톰의 시제품을 생산하고, KT 클라우드와 미국 IBM에 공급한 바 있다.
무엇보다 리벨리온이 양산에 본격적으로 나서는 것은 고객사가 확보됐다는 의미로 해석된다. MPW 과정에서 고객 수요 및 주문 확인이 이뤄지면 한 웨이퍼에 하나의 반도체만 생산하는 '싱글런'으로 작업을 시작하는데, 내년부터 이를 통해 칩 대량 양산에 나선다는 설명이다.
박성현 리벨리온 대표는 "아톰 칩은 올해 1분기 부터 양산이 시작될 예정"이라며 "시제품을 통해 커스터머 어트랙션(고객 유인)이 이뤄졌고 이제 제품을 쓸 만한 고객들이 있어서 매스 프로덕션(양산)이 이뤄지게 됐다"고 밝혔다.
한편 아톰의 차세대 제품인 '리벨'도 개발중이며, 리벨은 초거대언어모델(LLM)에 특화된 차세대 반도체이다. 리벨은 삼성 파운드리 4나노 공정으로 진행되며 올해 하반기 개발을 완료한다는 목표다.
3. 주요 고객
최근 close한 Series B 펀딩 금액1650억원 가운데 330억원은 AI 반도체 사업 파트너인 KT그룹이 투자했다. 구체적으로 KT·KT클라우드·KT인베스트먼트가 각각 200억원·100억원·30억원을 투자했다.
KT그룹은 2022년 리벨리온에 335억원을 투자한 데 이어 330억원을 추가 투자하며, 전략적 투자자(SI)로서 'AI 풀스택' 전략에 속도를 낼 방침이다. 리벨리온은 KT그룹과 초거대 AI와 초거대언어모델(LLM)의 두뇌 역할을 할 'AI 데이터센터' 사업을 위해 협력하고 있다.
KT그룹과 리벨리온은 우선 올해 중 리벨리온이 양산하는 차세대 AI 반도체 '아톰 플러스'를 활용해 AI 데이터센터 사업을 본격화할 전망이다. KT 기술혁신부문에서 개발한 AI 파운데이션(기초) 모델 '믿음' 기반 LLM과 아톰 플러스를 기업과 정부 기관에 함께 제공해 빠르고 저렴하게 업무에 생성 AI를 도입할 수 있도록 지원하는 게 목표다. 아톰 플러스는 리벨리온이 지난해 선보인 2세대 AI 반도체 '아톰'을 기반으로 양산에 앞서 AI 추론(실행) 성능을 한층 끌어올린 2.5세대 AI 반도체다.
또한, KT그룹은 리벨리온이 삼성전자와 공동 개발하는 차세대 AI 반도체 '리벨'도 적극 채용할 방침이다. 리벨은 그래픽 더블 데이터 레이트(GDDR) D램을 탑재한 아톰 플러스보다 상위 제품이다. 삼성전자가 공급한 HBM D램을 탑재, 700억개(70B) 이상 매개변수(파라미터)를 갖춘 LLM도 단일 칩에서 추론할 수 있는 게 특징이다. 리벨에는 효율적인 데이터 전송을 위해 삼성전자의 이종 반도체 패키징 기술인 '3차원(3D) 칩렛'과 '인터포저'도 적용한다.
황태현 KT클라우드 대표는 "KT그룹의 이번 투자로 국내 AI 반도체 선두 주자인 리벨리온이 글로벌 기업으로 성장하는 발판을 마련할 것"이라며 "앞으로 리벨리온을 포함해 다양한 파트너 기업과 초거대 AI 산업용 인프라 고도화를 위한 투자와 사업 협력을 지속할 것"이라고 밝히기도 하였다. KT그룹은 그동안 KT클라우드, 리벨리온, 업스테이지, 모레, 콴다 등 초거대 AI 생태계를 대표하는 기업들과 국산 기술 기반 소프트웨어·하드웨어를 아우르는 AI 동맹을 기반으로 AI 사업전략을 펼쳐온 바 있다.
4. 주요 프로젝트: K 클라우드
과학기술정보통신부(이하, 과기정통부) 이종호 장관은 지난해 6월 26일, 판교 NHN클라우드에서 제3차 ‘인공지능 반도체 최고위 전략대화’를 주재하고, ‘K-클라우드 프로젝트’ 1단계 착수보고회를 가졌다
K-클라우드 프로젝트’는 세계 최고 수준의 초고속·저전력 국산 AI 반도체를 개발, 이를 데이터센터에 적용하여 국내 클라우드 경쟁력을 강화하기 위한 정책이다. 정부는 지난해 12월 '국산 AI반도체를 활용한 K-클라우드 추진방안'을 발표하였다.
이를 통해 2023년부터 2030년까지 총 8,262억원(예정)을 투자하여 국산 AI반도체를 3단계 NPU(Neural Processing Unit) → 저전력PIM(Processing in Memory) → 극저전력PIM)에 걸쳐 고도화하고, 단계별로 데이터센터에 적용하여 클라우드 기반 AI서비스까지 제공하는 실증사업도 함께 추진한다고 밝힌 바 있다.
이번에 착수하는 ‘K-클라우드 프로젝트’ 1단계 사업은 현재 상용화 초기 단계에 있는 국산 NPU를 데이터센터에 적용하고 클라우드 기반 AI 서비스까지 제공하는 실증사업이다.
국산 NPU 데이터센터 구축사업(신규)과 기존의 AI·클라우드 서비스 개발 사업을 연계하여 2023년 약 376억원을 시작으로, 2025년까지 약 1천억원(잠정)을 투자한다. 올해 2월 사업 공고를 시작하여 5월에 협약을 완료하였으며, 오늘 착수보고회를 계기로 본격적인 사업에 착수한다.
그간 정부는 AI반도체 기술개발에 꾸준히 투자해왔으며, 그 결과 현재 여러 국산 AI반도체(NPU)가 출시되어 상용화 초기 단계에 있다. 본격적인 시장 진출을 위해서는 일정 규모 이상의 실제 데이터센터와 서비스에 적용하여 검증된 레퍼런스를 확보하는 것이 중요하다.
이에 정부는 ‘K-클라우드 프로젝트’를 통해 올해부터 국산 NPU 데이터센터 구축사업 등에 착수, 국산 AI반도체를 클라우드 데이터센터에 적용하고 서비스까지 실증하여 레퍼런스를 조기 확보할 수 있도록 지원한다. 이를 통해 국산 AI반도체의 국내 시장을 조기 창출할 뿐 아니라 글로벌 시장 진출까지도 지원한다는 계획이다.
‘K-클라우드 프로젝트’ 1단계 ‘국산 NPU 데이터센터 구축사업’ 은 2개 사업으로, 민간과 공공(광주) 2개 부문에 각각 데이터센터를 구축한다. 공고 당시 각 사업당 목표는 ‘연산용량 10PF(PF: Peta-FLOPs, 1초당 1,000조번의 부동소수점급 연산) 이상’의 국산 NPU 기반 데이터센터 구축이었으나, 참여 기업들의 적극적인 의지로 각 데이터센터의 연산용량이 2배로 확대되어 총 39.9PF 규모로 착수한다.
동 사업에는 국내 클라우드·AI반도체·AI서비스 기업이 컨소시엄으로 참여하며, 클라우드 기업은 네이버클라우드·NHN클라우드·KT클라우드, AI반도체 기업은 리벨리온·사피온코리아·퓨리오사AI가 참여한다.
▷KT클라우드(대표 윤동식)는 이번 사업에서 민간과 공공 부문(각 4.45PF)을 더해 8.9PF 규모의 국산 AI반도체 기반 데이터센터와 클라우드 플랫폼을 설계·구축하고, AI응용서비스를 실증할 계획이다.
국산 AI반도체, SW스택, 클라우드 플랫폼, AI응용서비스까지 어우르는 AI 풀스택(Full-stack)을 완성해 오는 2025년까지 글로벌 시장에 진출하겠다는 포부도 밝혔다. KT의 초거대 AI인 ‘믿음’의 국산 AI반도체 기반 상용화 가능성도 이번 사업을 연계하여 검증할 예정이다.
한편, KT클라우드는 지난달 30일 리벨리온의 '아톰(ATOM)'을 탑재한 클라우드 기반 NPU 인프라 서비스의 상용화 착수를 국내 최초로 추진한 바 있다. 별도 서버 구축 없이도 전용 포털을 통해 몇 번의 클릭만으로 고객이 직접 자원 생성, 연산 세션 활용, 관리 및 모니터링 등을 할 수 있도록 사용 편의성을 높였다.
클라우드 기업 뿐 아니라 사업에 참여하는 AI반도체 기업들도 각자의 각오를 밝혔다. 리벨리온의 삼성전자의 5나노 EUV 공정을 통해 생산된 AI반도체인 아톰(ATOMTM)으로 현재 국내에서 유일하게 부동소수점(Floating point) 연산을 지원한다. ▶리벨리온(대표 박성현)은 이번 사업에 아톰을 활용, 1차년도에 2PF 이상, 3차년도까지 총 8.9PF 이상의 칩을 공급하고 지능형 관제 솔루션과 헬스케어AI 솔루션을 실증할 예정이다.
5. 최근 기술 동향
올해 2월에 열린 글로벌 반도체 학회 ‘ISSCC 2024(국제고체회로학회)’에 참가해 최근의 기술 개발 성과에 대해 공유하였다. ISSCC는 반도체 회로 설계 분야에서 가장 명망 있는 학술대회로 약 3천 명의 연구자들이 참여한다. 삼성전자, SK하이닉스는, TSMC, 인텔, 엔비디아, AMD, 미디어텍, 구글 등 글로벌 테크 기업들이 첨단 기술을 발표한다.
올해 학회는 미국 샌프란시스코에서 2월 18일(현지시간)부터 5일간 개최되었다. 리벨리온은 19일 진행된 ‘프로세서 및 커뮤니케이션 시스템온칩’ 세션에서 논문을 발표했다.
리벨리온은 "ISSCC가 기술에 대한 이론적 주장을 넘어 실제 구현된 칩을 기반으로 제품성능의 실현가능성을 검증하는 학회인만큼, 이번 논문 채택과 발표는 곧 리벨리온의 실제 제품 경쟁력에 대한 신뢰성을 보여준다"고 밝혔다.
논문에서 리벨리온은 인공지능 추론용 시스템온칩 ‘아톰(ATOM)’ 설계에 적용된 리벨리온의 고유한 기술을 설명하고, 이를 바탕으로 작은 크기의 칩으로도 높은 수준의 연산 능력을 발휘할 수 있음을 증명했다.
특히,
▲다양한 목적에 따라 활용될 수 있는 (flexible) AI 연산 코어
▲온칩(On-chip) 네트워크
▲속도에 방점을 둔 메모리 아키텍처 등
고도화된 설계 방식을 활용해 타사 GPU와 NPU 대비 높은 컴퓨팅 자원 활용 역량을 선보였다. 이번에 공개된 기술은 올 상반기 양산에 나서는 데이터센터향 AI반도체 ‘아톰(ATOM, 사실은 아톰 플러스)’에 적용됐다.
논문 세션에 이어 리벨리온은 ‘아톰’을 활용한 실시간 데모 시연도 함께 진행했다. 이번 시연에서 ‘아톰’은 LLM 모델 구동과 이미지 생성 등 생성형AI 추론 영역에 있어 GPU 대비 높은 에너지 효율성을 보이며 학계와 글로벌 업계 관계자의 주목을 받았다.
아톰을 기반으로 이미지 생성 모델과 언어 모델을 가속 시연한 결과, 전력 소모량은 보편적인 GPU 대비 5분의 1 수준으로 나타났다. 데이터 처리에 필요한 에너지 양을 나타내는 J/TOKEN도 GPU 대비 3~4.5배 효율적인 것으로 나타났다.
또한 리벨리온은 확장 가능하고 프로그램이 가능한(Programmable) 코어를 기반으로 아톰을 설계했다. 이를 통해 현재 국내 양산 제품 중 유일하게 비전과 언어모델을 모두 지원 가능하다는 게 리벨리온의 설명이다.
다음은 오진욱 CTO와의 일문일답이다.
Q. 리벨리온의 AI 칩 제품군 중에서 아톰을 이번 ISSCC 2024의 논문 주제로 선택한 이유는?
"리벨리온은 지난 2021년 처음으로 출시한 AI 반도체 ‘아이온(ION)’으로 자사 코어 아키텍처의 경쟁력을 보여준 바 있다. 두번째로 출시한 ‘아톰(ATOM)’은 리벨리온의 기술이 담긴 코어를 스케일업(Scale-Up)해 코어의 확장가능성을 보여준 제품이다.
리벨리온은 아톰에 고유한 코어 설계 기술을 녹여내는 한편, 범용성과 높은 속도를 실현하기 위해 다양한 칩 기술을 집약했다. 이 같은 기술적 성과를 상용화 단계의 제품에 담아냈음을 증명하고자 이번 논문에서 아톰을 다뤘다."
Q. 이번 행사에서 아톰의 첫 데모 시연이 있었다. 전력 효율성에서 어떠한 성능을 입증했는지?
"이번 ISSCC에서 아톰을 기반으로 이미지 생성 모델과 언어 모델을 가속하는 시연을 진행했고, 보편적으로 활용되는 GPU 모델과 아톰을 비교했다. 우선 아톰의 절대적인 전력 소모량은 GPU 대비 5분의 1 수준으로 매우 적게 나타났다.
두번째로, 에너지 효율성 측정을 위해 J/TOKEN을 단위로 활용했다. 이 경우 ‘아톰’이 GPU 대비 3~4.5배 더 효율적인 것으로 측정됐다. 토큰은 컴퓨터가 이해할 수 있는 가장 작은 텍스트의 단위다. 한마디로 J/TOKEN은 하나의 데이터 처리를 위해 필요한 에너지의 양을 나타낸다고 볼 수 있다."
Q. 논문 및 시연에 대한 방문객들의 반응은?
"이번 ISSCC에는 구글, 엔비디아, 애플 등 생성형AI 기술을 선도하는 회사들이 참여했다. 리벨리온의 발표에 대해선 저희의 하드웨어 뿐 아니라 컴파일러 기술에 대한 좋은 평가를 받았다.
또한 ISSCC 2024에서 아톰의 첫 데모 시연을 진행했는데, 리벨리온의 부스가 유독 붐비며 전문가들의 관심을 불러일으켰다. 특히 방문자들로부터 확산(Diffusion) 모델 기반의 데모를 보는 건 처음이라며, 비교 대상인 GPU와 비교했을 때 성능과 효율성에 대해 놀랍다는 반응을 받았다. 또한 타사 제품과 다르게 여러 알고리즘을 돌릴 수 있는 저희만의 범용성(Versatality)에 대한 좋은 평가를 받기도 했다."
Q. 아톰에 적용된 설계 방식의 특징이 궁금하다.
"리벨리온이 아톰을 설계하며 내세운 목표는 속도와 성능 중 양자택일이 아닌 두 가지 모두를 잡은 칩을 만들자는 것이었다. 이번 논문에서는 이러한 목표를 달성하기 위한 리벨리온의 설계 기술이 축약돼 있다.
먼저 아톰은 효율을 높일 수 있는 코어 구조를 채택했다. 영어로 풀어내면 ‘Flexible AI Compute Core’라고 할 수 있는데, 이러한 구조를 채택한 리벨리온의 고유한 코어를 ‘DNC(Dual Neural Core)’라고 부른다.
대다수의 NPU가 한정된 작업만을 가속할 수 있는데 비해, 리벨리온의 코어는 비전모델, 언어모델 등 다양한 작업을 지원하도록 설계됐다. 때문에 가속해야하는 AI 작업종류에 관계없이 안정적으로 높은 수준의 성능을 보장한다는 점이 특징이다.
뿐만 아니라 더 빠른 속도를 달성하기 위해 머신러닝 작업에 최적화된 D램 메모리(Hierarchical Memory) 구성 방식을 적용했다. 또한 코어 간 데이터 커뮤니케이션 시스템을 효율화해, 지연을 최소화하는 등 설계 초기 단계에서부터 속도와 성능을 확보하기 위한 독자적 기술을 발전시켜 왔다."
Q. 리벨리온이 바라보는 NPU 시장의 전망과 이에 대응하는 전략은 무엇인가?
"생성형 AI 시대가 도래하면서, 한 두가지의 작업이 아닌 비전 모델, 언어 모델 등 다양한 종류와 크기의 AI 작업을 처리해야 하는 상황이 요구되고 있다. 이에 따라 AI 내부에서의 범용성과 유연성의 중요성이 높아지고 있다.
앞서 말했듯, 리벨리온은 아톰 칩 설계 단계부터 범용성을 중요한 요소로 보고 이를 중심으로 개발을 진행했다. 현재 국내 양산 제품 중 비전과 언어모델을 모두 지원하는 제품은 아톰이 유일하다.
또한 차세대 칩에서는 성능을 더욱 높일 계획이다. 리벨리온은 대규모(1천억 파라미터 수준)의 언어모델을 지원하기 위해서 칩렛(다른 기능을 가진 반도체를 하나의 칩으로 이어붙이는 패키징 기술) 구조를 활용한 차세대 AI반도체 '리벨(REBEL)'을 개발하고 있다."
Q. 반도체 스타트업으로서 ISSCC에 참여한 소감은?
"ISSCC는 말 그대로 ‘회로’를 다루는 학회기 때문에 반도체 하드웨어의 성능을 검증할 수 있는 좋은 무대다.
출처: 아주경제, ZDnet, AI타임즈, 뉴스원
뜨리스땅
https://tristanchoi.tistory.com/636?category=861489
https://tristanchoi.tistory.com/580
'반도체, 소.부.장.' 카테고리의 다른 글
한미반도체 근황 update - 듀얼 TC 본더 그리핀 본격 납품 (0) | 2024.03.25 |
---|---|
리벨리온(Rebellion, AI 반도체 기업) 투자유치 뒷 이야기 (3) | 2024.03.24 |
엔비디아(NVIDIA)의 그루트(Groot? GR00T?) (1) | 2024.03.23 |
젠슨황 엔비디아 GTC 2024 기조연설(Keynote Speech) (0) | 2024.03.19 |
AI시대 ‘탈 엔비디아’ 노리는 K-클라우드 (0) | 2024.03.18 |
댓글