본문 바로가기

분류 전체보기673

에코 시스템 구축을 통해 Blackwell GB200 시스템의 발열 해소를 위한 NVIDIA의 노력 지난 2024 OCP 글로벌 서밋에서 NVIDIA는 NVIDIA GB200 NVL72 랙 및 컴퓨트와 스위치 트레이 액체 냉각 설계를 Open Compute Project(OCP)에 제공했다고 발표했다. NVIDIA는 이에 대한 세부 사항을 제공하며, 현대 데이터 센터의 높은 컴퓨팅 밀도 요구를 충족하기 위해 기존 설계 표준의 활용성을 어떻게 증가시키는지 설명하였다. 또한 GB200 설계를 기반으로 생태계가 구축되면서 새로운 AI 데이터 센터의 비용과 구현 시간을 줄이는 방법도 연구하고 있다.  NVIDIA의 오픈 소스 이니셔티브 NVIDIA는 오픈 소스 이니셔티브에 대해 다양한 활동 역사를 가지고 있다. NVIDIA 엔지니어들은 GitHub에 900개 이상의 소프트웨어 프로젝트를 공개했으며, AI 소프.. 2025. 1. 20.
NVIDIA의 Blackwell 발열 이슈는 해결 가능할까? 1. Blackwell은 발열 이슈가 있는가? 최근 Nvidia의 차세대 AI 칩인 Blackwell(블랙웰)과 관련하여 발열 문제와 양산 지연에 대한 여러 보도가 있었다. 이에 대해 젠슨 황 CEO가 공개한 주요 내용은 다음과 같다. 설계 결함 인정 젠슨 황 CEO는 Blackwell 칩에 설계 결함이 있었음을 인정했다. 그는 "Blackwell에 설계 결함이 있었다. 기능은 했지만 이 결함으로 인해 수율이 낮아졌다"고 밝혔습니다. 또한 이 문제가 "100% Nvidia의 잘못"이라고 명확히 했다. TSMC와의 관계 일부 언론에서 TSMC와 Nvidia 사이에 긴장 관계가 있다고 보도했으나, 황 CEO는 이를 "가짜 뉴스"라고 일축했다. 오히려 TSMC가 수율 문제를 극복하고 Blackwell 생산을 .. 2025. 1. 19.
자동차 반도체 아키텍처와 국제 표준 - ISO26262 오늘날 자동차는 터치 인터페이스, 배터리 관리 시스템 등 다양한 애플리케이션을 통해 적게는 수백 개 많게는 수천 개에 달하는 반도체와 여러 가지 부품을 사용하고 있다.ISO(International Organization for Standardization)26262는 이처럼 갈수록 복잡하고 정교해지는 애플리케이션이 안전하게 작동하도록 엄격하게 보장하는 역할을 하고 있다.그러나 이 기능 안전성 국제 표준에 부합하는 디자인을 개발하고 인증을 획득하는 과정에는 상당한 시간과 비용이 소요된다.이 문제를 해결하기 위해 반도체 업계는 자동차 OEM과 부품 공급업체에게 이러한 인증 프로세스를 완료하는 데 필요한 비용, 리스크 및 개발 시간을 최소화할 수 있는 완벽한 기능 안전성 에코시스템을 제공하고 있으며 이에 따.. 2024. 12. 28.
구글 딥마인드, 반도체를 설계하는 AI - 'AlphaChip' 공개 구글 딥마인드가 반도체 칩 설계 과정을 혁신할 AI 기반 시스템인 'AlphaChip'을 공개했다.   반도체를 설계하는 과정은 크게 논리적인 설계와 물리적인 설계의 2가지의 과정이 있는데,  1) 논리적인 설계는 어떤 논리 흐름으로 주어진 정보를 처리할 것인가를 설계하는 것이고, 산출물로는 net list라고 하는 gate의 리스와 배치 내용이 나온다. 2) 물리적인 설계는 net list에서 정의된 논리 회로 gate들을 실제로 주어진 chip 면적에 어떻게 트랜지스터와 스위치 등을 구현하는지에 대한 설계도를 만들어내는 작업이다.  이 중 물리적 설계 과정에서 건축 설계에서 도면을 그리는 것과 같은 레이아웃을 그리는 작업인 floor plan을 하게 되는데, 물리적인 device나 스위치등을 어떤 크.. 2024. 9. 30.
AI반도체 설계 시 중요한 부분: 메모리 계층 구조 AI 반도체를 설계할 때 중요한 부분이 메모리 계층 구조(Memory Hierarchy)의 설계를 얼마나 효율적으로 하는 것이냐 하는 것이다. 메모리 계층 구조의 설계가 효율적으로 되면, 불필요한 데이터 이동이 없기 때문에 AI 반도체의 속도가 빨라지고 소비 전력이 줄어들게 된다. AI 반도체로 사용되는 GPGPU를 만드는 NVIDIA 뿐만 아니라, AI 전용 반도체를 표방하는 많은 반도체 스타트업들의 경우, HBM을 사용하지 않고 SRAM과 GDDR 만을 사용해서 AI 반도체를 설계하는데, 그렇게 할 수 있는 이유가 메모리 계층 구조를 효율적으로 설계하기 때문이다. AI 반도체의 메모리 계층 구조 AI 반도체의 메모리 계층 구조는 성능과 용량의 균형을 맞추기 위해 여러 단계로 구성되어 있습니다. 상위 .. 2024. 9. 28.
HBM을 처음으로 개발 요청한 것은 NVIDIA가 아닌 AMD HBM 개발의 역사 HBM(High Bandwidth Memory) 개발을 처음 요청하고 주도한 것은 일반적으로 사람들이 짐작하는 것과는 달리 NVIDIA가 아닌 AMD이다. AMD는 2008년부터 HBM 개발을 시작했다. 당시 AMD는 컴퓨팅 시 메모리 쪽에서 소비되는 전력이 증가하고 폼팩터로 인해 용량 제한이 발생함에 따라 이에 대한 문제 해결 방안이 필요했다.  AMD에서 HBM 개발을 주도한 인물은 Senior Fellow인 Bryan Black였고, Bryan이 이끄는 팀이 다이 스태킹 문제 해결을 위한 절차를 개발하기도 했다. 그러나, AMD는 HBM 비전을 실현하기 위해 혼자 할 수는 없었고 파트너가 필요로 했다. 그래서 SK 하이닉스(메모리), UMC(인터포저), Amkor Technolo.. 2024. 9. 28.