pillar

MRDIMM이란? DDR5의 대역폭 한계를 다중 rank mux로 넘는 AI 서버 메모리의 backbone

CPU 코어 수는 빠르게 늘지만 DDR5 채널당 대역폭은 그보다 느리게 성장한다. MRDIMM은 RCD와 데이터 버퍼(DB)에 mux 회로를 더해 두 rank를 host 입장에서 하나의 더 빠른 sub-channel로 묶는 JEDEC 표준이다. Intel Granite Rapids가 첫 적극 채택 플랫폼이고, 한국 메모리 3사 모두 양산 라인업에 올리고 있다. 이 글은 MRDIMM의 동작 원리, DB IC의 mux 회로 난점, latency·열·가격의 trade-off, 그리고 한국 메모리 산업이 mix 측면에서 얻는 것이 무엇인지

Chase Na - Semiconductor Design Engineer

23 5월 2026 · 12 min read ·

Photo by Taylor Vick on Unsplash

왜 지금 MRDIMM인가

2026년 데이터센터의 핵심 모순은 단순하다. CPU 코어 수는 매년 1.5~2배씩 늘지만, 표준 DIMM의 채널당 대역폭은 그보다 느리게 성장한다. Intel Xeon 6는 P-core 라인업만 해도 코어 수가 100을 훌쩍 넘고, AMD Turin은 192 코어를 한 소켓에 담는다. AI 인퍼런스 워크로드, 특히 LLM serving의 KV cache 운용은 흔히 코어 활용도보다 메모리 대역폭에 먼저 묶인다.

Micron DDR5 MRDIMM 128GB와 256GB 공식 제품 사진 — Micron DDR5 MRDIMM 128GB·256GB. 다중 rank와 데이터 버퍼를 쓰는 실제 서버 메모리 모듈이다 · 출처: Micron Technology

대안은 셋이다. 첫째, HBM을 CPU에 직접 붙이는 것 — 비싸고, 용량이 제한된다. 둘째, LPDDR을 서버에 넣는 것 — 신호 무결성과 폼팩터, ECC 운용 측면에서 표준 서버 슬롯과 맞지 않는다. 셋째가 MRDIMM이다. DRAM die는 표준 DDR5 그대로 두고, DIMM 위의 RCD(Registered Clock Driver)와 데이터 버퍼(DB)에 mux 회로를 더해서 호스트 입장에서 보이는 인터페이스 속도만 끌어올린다.

JEDEC이 MRDIMM(Multiplexed Rank DIMM)을 표준으로 정리하기 시작한 시점은 DDR5 출시 직후였고, Intel은 자사 코드명 MCR-DIMM(Multi-Combined Rank DIMM)으로 같은 컨셉을 먼저 밀어붙였다. 두 이름은 사실상 동의어로 통하며, Granite Rapids에서 처음으로 데이터센터 메인스트림 플랫폼이 정식 지원하는 형태로 시장에 들어왔다. 즉 MRDIMM은 'AI 시대의 RDIMM 다음 단계'를 노리는 표준이다.

기술의 실체 — mux와 sub-channel

먼저 DDR5의 채널 구조를 짚어야 한다. 기존 DDR4가 64-bit 단일 채널을 썼다면, DDR5는 같은 DIMM에서 32-bit 두 sub-channel을 독립적으로 동작시킨다. 짧고 빠른 burst 두 개가 병렬로 도는 셈이라, latency가 같더라도 동시 transaction 수가 늘어 실효 대역폭이 좋아진다.

MRDIMM은 여기에 한 단계를 더 얹는다. 한 DIMM에 두 rank가 올라가는 것은 기존 RDIMM과 동일하지만, DB IC가 두 rank의 데이터 스트림을 시간축으로 mux해서 host로 내보낸다. 호스트 메모리 컨트롤러 입장에서는 마치 더 빠른 단일 rank를 보고 있는 것처럼 동작한다. 내부적으로는 DRAM die가 표준 속도(예: 6400 MT/s)로 돌더라도, host-DIMM 인터페이스는 그 ~1.375배인 8800 MT/s로 운용된다. 이것이 MRDIMM Gen1의 핵심 트릭이다.

Gen2 MRDIMM이 노리는 숫자는 12800 MT/s 수준이다. 공개된 JEDEC 로드맵과 IC 벤더 발표를 종합하면 2026년 후반에서 2027년 초 사이가 합리적인 양산 진입 구간으로 보인다. 그 다음에는 DDR5 native 8000~8400 MT/s 위에 다시 mux 비율을 얹는 형태가 거론된다.

주의할 점: MRDIMM은 DRAM die 자체의 속도를 끌어올리는 기술이 아니다. tRCD/tCL 같은 DRAM array의 timing은 표준 DDR5와 동일하다. 바뀌는 것은 모듈 위 RCD/DB의 mux 로직, 그리고 host 메모리 컨트롤러가 인식하는 인터페이스 속도뿐이다. 그래서 DRAM 메이커가 추가로 만들 die가 없다는 점이 시장 진입 속도에 큰 영향을 준다.

왜 어려운가 — DB·SI·열·latency

겉보기엔 '두 rank를 mux로 묶는다'가 단순해 보이지만, MRDIMM 양산에는 적어도 네 가지 까다로운 trade-off가 동시에 걸려 있다.

첫째, DB IC의 mux 회로 자체. 두 rank에서 오는 burst 데이터의 정렬, jitter budget, eye opening을 모두 보존한 채 host bus 속도로 직렬화해야 한다. RCD가 신호 분기와 클럭 재생성을 맡지만, MRDIMM은 거기에 추가로 데이터 도메인의 mux/demux를 정확히 같은 위상으로 맞춰야 한다. DB IC가 단순한 버퍼에서 mux + retimer 결합형으로 진화한 것이 이 때문이다.

둘째, 채널 신호 무결성(SI). 8800 MT/s 영역이 되면 DIMM 슬롯-host 간 트레이스가 만드는 ISI, reflection, crosstalk가 무시할 수 없다. host 메모리 PHY 입장에서는 더 강한 equalization(DFE/FFE)이 필요하고, board의 stack-up, via 설계, BGA fan-out까지 모두 영향을 받는다. DDR5 RDIMM 6400 보드를 그대로 8800 MRDIMM에 쓰기 어렵다는 뜻이다.

셋째, 열. DB IC는 항상 풀스피드로 mux/retime을 돈다. DIMM 위에 여러 개의 DB가 올라가면 모듈 전체의 power dissipation이 RDIMM 대비 눈에 띄게 늘어난다. 1U 서버 chassis에서 DIMM 측 풍속과 heatsink 설계가 빠듯해진다. 하이엔드 MRDIMM 모듈에 본격적인 vapor chamber나 추가 heatspreader가 들어가는 이유다.

넷째, latency. mux 단을 한 번 더 거치는 만큼 절대 latency는 RDIMM 대비 약간 늘어난다. AI inference, in-memory analytics처럼 bandwidth-bound 워크로드에서는 손해가 작지만, OLTP나 sub-microsecond response를 다투는 워크로드에서는 RDIMM이 여전히 매력적이다. MRDIMM이 모든 서버를 대체하지 않는 이유다.

누가 잘하고 있나 — Intel·AMD·DB IC 3사

플랫폼 측: Intel이 MRDIMM 채택에서 가장 적극적이다. Granite Rapids 기반 Xeon 6의 일부 SKU는 MRDIMM 8800 MT/s를 정식 지원하고, 자사 마케팅에서도 메모리 bandwidth per core 우위 포인트로 활용한다. 자사 코드명 MCR-DIMM은 JEDEC MRDIMM과 사실상 같은 트랙이며, 2세대로 12800 MT/s를 향한 로드맵이 공개돼 있다.

AMD는 좀 더 신중한 접근을 보였다. 4세대 EPYC(Genoa)에서는 RDIMM 4800/5600 중심으로, 5세대 Turin에서 MRDIMM 지원을 일부 도입하는 흐름이다. 보도 기반으로는 Venice 세대에서 MRDIMM 폭이 의미 있게 커질 것으로 정리된다. ARM 서버 진영(NVIDIA Grace, Ampere, AWS Graviton)은 LPDDR 또는 HBM 우선 전략과 겹치는 부분이 있어, 적어도 현재까지는 MRDIMM 채택이 상대적으로 제한적이다.

핵심 IC 측: DDR5 세대에 들어 RCD/DB 시장은 사실상 세 회사 — Renesas(구 IDT)·Rambus·Montage Technology — 의 과점 구조다. MRDIMM도 같은 3사가 양산 라인을 깔고 있고, MR을 위한 DB IC의 면적과 전력 효율이 핵심 경쟁축이다. 공개된 자료 기준 IC 노드는 16nm/12nm 영역에서 점차 더 낮은 노드로 내려오는 흐름이며, 미세화가 mux 회로의 power/latency 마진을 확보하는 길이다.

모듈 측은 한국과 미국 3사 — 삼성전자, SK하이닉스, 마이크론 — 가 모두 MRDIMM 라인업을 깔고 있다. 일부 대만/중국 모듈러도 진입하지만, 데이터센터향 메인 공급은 여전히 D램 3사 중심이다.

Korea 시각 — ASP mix는 좋지만 IC 가치사슬은 외부

한국 메모리 산업이 MRDIMM에서 얻는 것은 명확하다. DRAM die는 표준 DDR5와 동일하기 때문에, 새로운 die 개발 부담이 없다. 즉 capex 추가 없이 기존 DDR5 라인의 산출물을 더 비싼 모듈로 묶어 판매할 수 있다는 뜻이다. RDIMM 대비 MRDIMM의 ASP premium은 DB IC와 모듈 조립 난이도를 반영해 두 자릿수 퍼센트 수준에서 시작하며, 본격 보급 구간에서는 모듈 mix 개선의 핵심 카드로 작용한다.

그러나 구조적 약점도 분명히 있다. DB와 RCD IC를 공급하는 한국 회사가 사실상 없다. Renesas는 일본, Rambus는 미국, Montage는 중국·미국 합작 성격으로, 모듈 가치 중 IC 부분은 한국 매출로 잡히지 않는다. 한국 입장에서 이 부분은 두 가지 전략으로 풀 수 있다. 하나는 RCD/DB IC를 국내 팹리스(메모리 자회사군이나 신생 design house)가 설계하고 삼성·DB하이텍 파운드리에서 양산하는 형태, 다른 하나는 메모리 사업부 안에 buffer/controller IP 인하우스를 키워 모듈 단가 협상력을 회복하는 형태다. 후자는 사내 controller 팀에서 일부 시도되어 온 영역으로 알려져 있다.

또 하나 짚을 점은 서버 OEM과의 관계다. Inspur, Foxconn, Quanta, Wiwynn 같은 ODM이 MRDIMM 모듈 채택을 본격화하면, 한국 모듈러의 export 비중이 늘어난다. AI 서버 한 대당 메모리 용량/속도 mix가 모두 상승하기 때문에, 모듈 단위 매출 기여도가 일반 cloud 서버보다 크다. SK하이닉스가 HBM과 함께 MRDIMM을 묶어 hyperscaler에 제안하는 그림이 자연스럽게 짜인다.

Watch points — 6~12개월의 5가지

다음 6~12개월 동안 시장이 주목할 만한 마일스톤은 다음과 같다.

Gen2 MRDIMM(12800 MT/s)의 본격 샘플과 양산 진입 시점. JEDEC 표준이 안정화되고, Intel 후속 플랫폼이 정식 지원하는 시점에 메모리 3사의 출하 mix가 한 단계 더 올라간다.
AMD Turin/Venice 세대의 MRDIMM 지원 폭. 일부 SKU 한정인지, 메인스트림 전반인지에 따라 모듈 수요 곡선이 달라진다.
Hyperscaler(AWS·Azure·GCP·Meta)의 MRDIMM 채택률. AI inference fleet과 일반 cloud VM fleet 사이 mix가 어디로 기우는지가 ASP 안정성에 직결된다.
RCD/DB IC 3사의 가격·공급 경쟁. Montage의 미세화 속도, Rambus·Renesas의 thermal 솔루션이 모듈 가격을 좌우한다.
DDR6 표준에서 MRDIMM 컨셉의 흡수 여부. 차세대 표준이 native로 더 빠른 인터페이스를 제공하면 MRDIMM의 '수명'이 정의된다. 반대로 DDR6에도 MRDIMM류의 mux 구조가 표준 옵션으로 들어가면, mux 기반 멀티 rank가 데이터센터 메모리의 기본 문법으로 굳어진다.

자주 묻는 질문

MRDIMM과 RDIMM의 핵심 차이는? RDIMM은 RCD로 address/command만 버퍼링하고 데이터는 host와 DRAM이 직접 주고받는다. MRDIMM은 DB가 두 rank의 데이터 스트림을 mux해서 host 인터페이스 속도를 1.375배 이상으로 끌어올린다.

MCR-DIMM은 다른 표준인가? 사실상 같다. MCR은 Intel의 코드명, MRDIMM은 JEDEC의 표준 명칭이다. 시장에서는 혼용되지만 IC·모듈 사양은 사실상 동일한 트랙을 따라간다.

HBM, LPDDR, MRDIMM 중 무엇이 좋은가? 워크로드와 폼팩터에 달렸다. HBM은 최고 BW지만 용량·가격 제약이 크고, LPDDR은 전력 효율이 좋지만 서버 표준 슬롯과 ECC 운용이 까다롭다. MRDIMM은 표준 DIMM 슬롯을 그대로 쓰면서 BW를 끌어올리는, 가장 보수적이고 호환적인 길이다.

데스크톱이나 워크스테이션에도 쓸 수 있나? 현재까지 MRDIMM은 서버 폼팩터(특히 DDR5 RDIMM 호환 슬롯) 중심으로 전개된다. 일반 클라이언트 PC에서는 UDIMM/SODIMM 표준이 그대로 사용된다. MRDIMM이 가져오는 mux 비용·열·latency가 데스크톱 워크로드에서는 정당화되기 어렵다.

공유하기 토론 참여

이 글이 어떤 도움을 줬나요? 공개 숫자 없이 품질 개선 신호로만 사용합니다.

MRDIMM이란? DDR5의 대역폭 한계를 다중 rank mux로 넘는 AI 서버 메모리의 backbone

Chase Na - Semiconductor Design Engineer

왜 지금 MRDIMM인가

기술의 실체 — mux와 sub-channel

왜 어려운가 — DB·SI·열·latency

누가 잘하고 있나 — Intel·AMD·DB IC 3사

Korea 시각 — ASP mix는 좋지만 IC 가치사슬은 외부

Watch points — 6~12개월의 5가지

자주 묻는 질문

오류나 추가 설명이 필요한가요?

비공개 제보 보내기

현장에서는 어떻게 보고 계신가요?

매일, 중요한 신호만.

이런 기술 콘텐츠가 필요하신가요?

내 읽기 보관함

왜 지금 MRDIMM인가

기술의 실체 — mux와 sub-channel

왜 어려운가 — DB·SI·열·latency

누가 잘하고 있나 — Intel·AMD·DB IC 3사

Korea 시각 — ASP mix는 좋지만 IC 가치사슬은 외부

Watch points — 6~12개월의 5가지

자주 묻는 질문

글 참여 도구

오류나 추가 설명이 필요한가요?

매일, 중요한 신호만.

이런 기술 콘텐츠가 필요하신가요?

다음 읽기

Daily Silicon: 반도체 수출 180.6%: TSMC 2nm, EDA 원가

PCIe 8.0: 256 GT/s가 서버 보드 설계를 다시 쓰는 이유

팀 가이드: Formal Verification — 시뮬레이션이 못 잡는 corner를 수학으로 증명한다