Altium/Protel论坛 |  PADS论坛 |  Cadence Allegro论坛 | 

DDR5 PCBlayout设计指南(一)

本文将介绍什么是 DDR5,DDR5 和之前 DDR 的比较以及 DDR5 与 LPDDR5 的差异以及 DDR5 的拓扑结构。
什么是 DDR5?

先来看一下什么是 DDRDDR(Double Data Rate)属于SDRAM(Synchronous Dynamic Random Access Memory)的一种。DDR 的主要特点是数据传输速率更高。DDR 内存采用了一种称为“双倍数据速率”的技术,它可以在一个时钟周期内传输两次数据,即在时钟信号的上升沿和下降沿都能进行数据传输。而普通的 SDRAM 在一个时钟周期内只能在上升沿或者下降沿传输一次数据。

DDR5 是第五代 DDR 技术,核心技术参数如下:

  • 发布年份:2020

  • 数据速率:4800-6400 MT/s (未来有潜力达到更高速度)

  • 带宽:38.4-51.2 GB/s

  • 电压:1.1V (更低功耗) 

  • 密度:每颗 IC 高达 64 Gb

  • 通道配置:每 DIMM 双通道 (有效将可用通道数加倍)

  • 预取缓冲区:16n (DDR4 的两倍) 

  • 延迟:低于 DDR4

  • 提升的通道效率:双通道带来更高效的数据传输

  • 更佳的电源管理:芯片内置 ECC (错误修正码) 提升可靠性与性能

  • 改善的信号完整性:新功能如决策反馈均衡 (DFE)

总结一下 DDR5 的特点:

  • 速度与带宽:DDR5 提供比 DDR4 高出许多的数据速率与带宽。

  • 电源效率:DDR5 运作电压更低,从而降低功耗。

  • 密度与容量:DDR5 支持更高密度,允许更大的内存容量。

  • 通道配置:DDR5 的每 DIMM 双通道设计提升了通道效率。

  • 先进功能:DDR5 包含芯片内置 ECC 和改善的信号完整性机制等先进功能。
     

什么是 LPDDR5?

LPDDR5(Low Power Double Data Rate 5)是一种专门为移动设备和功耗敏感型设备(如智能手机、平板电脑、轻薄本)设计的内存标准。

它的核心特性是“低功耗”。它通过使用更低的工作电压(例如 1.05V 核心电压和 0.5V I/O 电压)和更先进的电源管理功能,来实现极高的能效,从而最大限度地延长设备的电池续航时间。

虽然两者都是“DDR5”家族的成员,但它们在设计理念、物理形态和性能侧重上有根本的不同。

特性 LPDDR5 (Low Power DDR5) DDR5 (Standard DDR5)
主要应用
智能手机、平板电脑、轻薄笔记本电脑、车载系统
台式机、服务器、工作站、高性能游戏本
设计目标 低功耗、延长电池续航、小体积 高性能、高带宽、高容量
物理形态 焊接在主板上(BGA 封装),呈小方块芯片状 插槽式内存条,可更换和升级
功耗与电压 极低。工作电压更低且通常是动态可变的(例如 1.05V / 0.5V) 较低(相比 DDR4)。标称电压通常为 1.1V
通道架构
通常为 16 位或 32 位通道,但可配置多通道以实现高带宽
单个内存条 (DIMM) 包含两个 32 位的独立通道(共 64 位)
性能
速率很高(例如 5500 MT/s, 6400 MT/s 或更高),但可能为换取低功耗而在延迟(Latency)上有所妥协
起始速率较高(例如 4800 MT/s),可超频至极高频率,通常在同等频率下具有更低的延迟和更强的综合性能
 

DDR5 与之前版本 DDR 对比

下图是 DDR 进化的图表:

 

可以看到,JEDEC 在 2021 年的时候发布了 CAMM2 模组,尝试解决 SODIMM 的系统级问题,CAMM2 从性能、尺寸、布线难度、可替换性、EMC 噪声等多方面进行了改进,后续章节会详细介绍。

 

下表是 DDR5 和之前 DDR 版本的一个比较:

DDR 版本
DDR1
DDR2
DDR3
DDR4
DDR5
电压
2.5V
1.8V
1.5V
1.2V
1.1V
预取缓存区
2
4
8
8
16
芯片密度
128Mb-1Gb
128Mb-4Gb
512Mb-8Gb
2Gb-16Gb
8Gb-64Gb
数据速率(MT/s)
200-400
400-800
800-2133
1600-3200
3200-6400
Bank 组
0
0
0
4
8
ODT
On Board
ODT Enabled
Normal, Dynamic Modes
Park Modes
Nominal Er/Rd
IO 时钟 MHz
100-200
200-533
533-1200
1066-2400
2133-3200

我们来回顾一下 DDR 的发展历史:

  • 由 IBM 于 1980 年代发明

  • 1990 年在国际固态电路研讨会上发表

  • 三星于 1998 年 6 月发布首款商用 DDR SDRAM 芯片 (64 Mbit)

  • JEDEC 于 2000 年 6 月敲定规格 (JESD79)

  • 首款使用 DDR SDRAM 的零售 PC 主板于 2000 年 8 月发布

  • DDR1 (2000): 在时钟的上升沿和下降沿皆传输数据,速率加倍

 
  • DDR2 (2003): 改善的 I/O 总线信号,双通道模式

 
  • DDR3 (2007): 增加的带宽,降低的功耗

 
  • DDR4 (2014): 四点时钟周期数据传输,高效的 DRAM Bank 组

 
  • DDR5 (2022): 更佳的电源管理,提升的通道效率,更强的性能

 
  • CAMM2 模组(2024)

 
  • LPDDR5 CAMM2(2024):低功耗DDR5
 


DDR5 DRAM 引脚

 

8位数据位宽的封装由 82 个 ball 组成,尺寸最大为 10mm x 11mm x 1 mm。上图右下为顶视图(右图为从定向下穿透视角)。做下中“+”表示没有 Ball。

 

16位数据位宽的封装由 106 个 ball 组成,尺寸最大为 10mm x 14mm x 1mm。

 
 
 

32 位数据位宽的 LPDDR5 封装由 315 个 ball 组成,最大尺寸为 12.4mm x 15mm x 1.1mm。 
 

目标阻抗

走线宽度对于匹配目标阻抗非常重要。实际宽度取决于电路板层叠结构。目标是:

DDR5

  • DQ/CA/CS => 40 Ohm

  • DQS => 75 Ohm

  • 时钟

    • 主板上和模组上到时钟缓冲器:75 Ohm 
    • 模组上从时钟缓冲器到 DRAM:45 Ohm 

LPDDR5:

  • DQ/CA/CS => 40 Ohm

  • DQS/CLK => 75 Ohm

  • WCK => 65 Ohm

以下是一个10层的 DDR5 CAMM2 示例:
 
 


间距

DDR5 布线的一个关键是保持 SOC 厂家给出的间距要求。当然可能的情况下间距越大越好。

以下是走线最小间距建议:

  • 时钟-时钟=> .25 mm

  • 时钟 到 CA=> .3 mm

  • CA 到 CA => .15 mm 

  • DQ 到 DQS .18 mm 

  • DQ 到 DQ => .18 mm 

  • BYTE 到 BYTE => .3 mm 

  • WCK 到 DQ => .375 mm 

  • WCK 到 DQS => .375 mm

  • 子通道 到 子通道 => .5 mm


线长匹配(DDR Memory Down)

长度匹配规范由 SoC 单独设置。通常,需要匹配以下组的值:
  • 时钟到时钟:一个通道中的所有时钟

  • 时钟到数据选通 (DQS)

  • 数据(DQ) 到 DQS

  • 一个字节内的 DQ

  • 命令地址 (CA) 线到钟

  • 一个子通道内的 CA 线

  • 片选(CS) 到时钟

  • 一个子通道内的 CS 线。

总线长匹配所需的额外数据:

  • 芯片供应商提供的 SoC 封装长度(焊盘到Die)

  • 打开 Electrical Z Axis Delay 选项

以下是单通道 1 个子通道 0A 的配置示例:

 

每个子通道包含以下信号:

  • 13 CA/4CS(蓝色)

  • 时钟(红色)

  • 每个DRAM 24 Data/4 DMI/4 DQS/8DQ/1 DMI/1 DQS(绿色)

可能的长度匹配规则:

  • 时钟到 CA < 10mm 

  • DQ-DQS < 0.5mm 

  • DQx8 < 0.5mm

  • 每个子通道的 CA < 1 mm

以下是调线长和过孔高度影响的布线技巧

  • 在 2 个相邻层上走所有 CA 线

  • 在同一层上走所有 DQ, DMI 和 DQS

  • 保持时钟线最短 – 它们决定一切

  • 检查封装长度 - 它们可能会破坏调线长的计划。

  • 注意规则,例如 (-20 < CLK-DQS) < 40)。举个例子,如果时钟是60 mm, DQS 长度可以在 80 mm 和 20 mm 之间。


线长匹配(LPDDR5 Memory Down)

长度匹配规范由 SoC 单独设置。通常,需要匹配以下组的值
  • 时钟到时钟 - 所有子通道时钟

  • 时钟到 DQS

  • DQ 到 DQS

  • 一个字节内的 DQ

  • CA 线到时钟

  • 一个子通道内的 CA 线

  • CS 到 时钟

  • 一个子通道内的 CS 线。

  • 写时钟 (WCK) 到 DQ

  • WCK 到 时钟

以下是单通道,4个子通道 0A/0B/0C/0D 的配置示例:

 

每个子通道包含以下信号信号:

  • 7 CA/4CS

  • 时钟

  • 16 Data/2 DMI/2 DQS

  • 2 WCK

可能的长度匹配规则

  • 时钟 到 CA < 5mm 

  • 时钟 到 WCK < 10 mm

  • DQ-DQS < 3 mm

  • DQx8 < 4mm

  • 每个子通道的 CA < 7 mm

以下是调线长和过孔高度影响的布线技巧

  • 在同一层上布线所有 CA 线

  • 在同一层上布线所有 DQ, DMI 和 DQS

  • 保持时钟线短 – 它们决定一切

  • 检查封装长度 - 它们可能会破坏调线长的计划。


DDR5 引脚交换(Pin Swapping)

DDR5 Layout 中允许进行一些位交换。字节分为 2 个半字节 (nibble):高位和低位。

例如:在位宽为 8 的器件上:

 

引脚 C3, C9, B4 和 B8 是分配给 DQ[0-3] 的低位;引脚 E3, E9, E4 和 E8 是分配给 DQ[4-7] 的高位。

每个半字节中的位可以在其内部交换。您也可以交换整个半字节,只要同组的 4 个网络保持在同一个半字节中。下图中绿色框是可以交换的示例,红色框因为网络不在同一个半字节中,因此不允许交换。

 

LPDDR5 引脚交换(Pin Swapping)

LPDDR5 layout 中允许进行一些位交换。

  • 字节内的任何位都可以交换

  • 不允许在字节之间交换

  • 可以在子通道内交换整个字节 (包括 WCK, DQS, DMI 和所有 DQ 线)

  • 如果可以使布线更整洁,可以交换整个子通道。

 

以下为可交换及不可交换的示例:

 

DDR5 镜像(Mirroring)

当 MIR 引脚连接到 VDD 时,DDR5 DRAM 会被镜像。CA 和 DQ 网络需要被镜像。要进行镜像,交换 SoC 网络 CA[0] 和 CA[1]、CA[2] 和 CA[3]、CA[4] 和 CA[5]、CA[6] 和 CA[7]、CA[8] 和 CA[9]、CA[10] 和 CA[11],以及 CA[12] 和 VDD。

顶层没有镜像的 DRAM:

 

底层 DRAM CA 及 DQ 被镜像:

 

LPDDR5 无法配置镜像。


DDR5 拓扑(Topologies)

讲拓扑前再明确一下 Channel(内存通道)、Subchannel(子通道)、Rank(内存列)定义和功能。


Channel(内存通道)

Channel 是 CPU 内存控制器与内存模组(DIMM,即内存条)之间的最高级别数据总线。当我们说一个 CPU 支持“双通道”(Dual-Channel)或“四通道”(Quad-Channel)时,指的是 CPU 有多少条这样独立的主高速公路。在 DDR4 时代,一个 Channel 对应一条 64-bit(不含ECC)的数据总线。在 DDR5 中,一个 Channel 依然是64-bit宽。例如,一个“双通道”CPU(如桌面i9 或 Ryzen 9)就拥有一个128-bit(2 x 64-bit)的内存接口。


Subchannel (子通道)

这是 DDR5 最核心的架构变革。DDR5 将每条 64-bit的 Channel(主通道)拆分成了两个独立的 32-bit 的 Subchannel(子通道)。如果包含 ECC(错误校验码),那么一个 64-bit 的 Channel 被分为两个 40-bit 的 Subchannel(32-bit 数据 + 8-bit ECC)。这两个 32-bit 的 Subchannel 是独立寻址和独立操作的,它们有各自的地址/命令总线。与 DDR4 相比,表面看都是获取 64 字节,但 DDR5 的优势在于它有两个32-bit子通道。当 Subchannel A 在忙于一个请求时,内存控制器可以立即向 Subchannel B 发送另一个完全独立的请求


Rank (内存列)

Rank 是一组物理 DRAM 芯片(内存颗粒)的集合,这些芯片共享同一个片选信号(Chip Select, CS),并共同组成了 Subchannel 所需的数据位宽。在DDR5中,一个 Subchannel 是 32-bit 宽。如果一根内存条使用的是x8(8-bit位宽)的内存颗粒,那么一个 Rank 就需要4个这样的颗粒(4 x 8 bits = 32  bits 来喂饱一个 Subchannel。

Single-Rank (1R)” DIMM 通常意味着它为每个 Subchannel 提供了1个 Rank。对于使用 x8 颗粒的 DIMM,它总共需要 4  (SubCh A + 4 (SubCh B) = 8 个颗粒。

“Dual-Rank (2R)” DIMM 意味着它为每个 Subchannel 提供了 2 个 Rank。它总共需要 8 (SubCh A) + 8 (SubCh B) = 16 个颗粒。


单 Subchannel 单 Rank x 16 DRAM

对于单个子通道,1个 Rank,16 位的 DRAM,需要 2 个颗粒。可以同侧或两侧摆放:

 

2 个 DRAM:

  • 有独立的数据总线

  • 连接同一个 CLK、CS 

  • 仅共享 CA 总线

  • CA、CS 和 CLK 采用菊花链拓扑(Daisy chain)

  • 1 个 ODT 引脚连接到 VDD 以表示子通道的末端

 


单 Subchannel 单 Rank x 8 DRAM

对于单个子通道,1个 Rank,8 位的 DRAM,需要 4 个颗粒。可以同侧或两侧摆放:

 

4 个 DRAM:

  • 有独立的数据总线

  • 连接同一个 CLK、CS 

  • 仅共享 CA 总线(两侧的情况 CA 可以镜像)

  • CA、CS 和 CLK 采用菊花链拓扑(Daisy chain)

  • 1 个 ODT 引脚连接到 VDD 以表示子通道的末端

 

单 Subchannel 双 Rank x 8 DRAM

对于单个子通道,2个 Rank,8 位的 DRAM,需要 8 个颗粒。

 

DRAM:

  • 分别在顶层、底层两侧

  • 共享数据总线 

  • 共享 CA 总线

  • CA、CS 和 CLK 采用菊花链拓扑(Daisy chain)

  • 每个 rank 有独立的 CLK、CS

    • 4 个 DRAM 连接到顶层的 CLK0 和 CS0

    • 4 个 DRAM 连接到底层的 CLK1 和 CS1

  • 1 个 ODT 引脚连接到 VDD 以表示子通道的末端

 


单 Channel 4 Rank x 8 DRAM

对于单个通道,4 个 Rank,8 位的 DRAM,需要 8 个颗粒。

 
  • DRAM 分别在顶层、底层两侧

  • 共享数据总线 

  • 共享 CA 总线

  • CA、CS 和 CLK 采用菊花链拓扑(Daisy chain)

  • 每个 rank 有独立的 CLK、CS

  • 镜像 DRAM

  • Rank 0 和 1 被镜像并共享 CA 和 DQ 线

  • Rank 2 和 3 被镜像并共享 CA 和 DQ 线

  • CA 线是菊花链和 T 型拓扑的结合

  • DQ 线可以是菊花链或 T 型拓扑

  • ODT 在 Rank 0 和 Rank 2 的末端连接到 VDD

 


LPDDR5 拓扑

16 位单 Channel  DRAM

来自 CAMM2 的每颗 DRAM 4 个数据字节,不可镜像。

 
 
  • DRAM 全部位于一侧

  • 独立的数据线 - 每个子通道 16 条

  • 启用 DMI

  • 双子通道

  • 每个子通道 7 条 CA 线

  • 4 条 CS 线 (如果需要)

  • 8mm 间距 – 适用于 BB Via 配置和盘中孔

 


去耦电容

DDR5 CAMM2 去耦电容指南:

电压

指南

备注

VDD

每颗 SDRAM 至少两个到 VSS 的去耦电容,建议每颗 DRAM 平均 30uF

应尽可能靠近 DRAM VDD 焊球

VDDQ

每颗 SDRAM 至少两个到 VSS的去耦电容,建议每颗 DRAM 平均 7.5uF

应尽可能靠近 DRAM VDDQ 焊球

VPP

每个 DRAM VPP 引脚至少一个去耦电容,建议每颗 DRAM 平均 3.5uF

应尽可能靠近 DRAM VPP 焊球

VIN_BULK

PMIC 输入附近:6 颗 22uf, 3 颗 0.1uF   CAMM2 

连接器 VIN_BULK 引脚附近:4 颗 22uF 或 0.1uF

 

VDD1
建议每颗 DRAM 平均 5uF
应尽可能靠近 DRAM VDD1 焊球
VDD2H
建议每颗 DRAM 平均 15uF
应尽可能靠近 DRAM VDD2H 焊球。如果 VDD2H 和 VDD2L 合并为一根电源轨,则将该轨的两个电容相加。
VDD2L
建议每颗 DRAM 平均 15uF
应尽可能靠近 DRAM VDD2L 焊球。
VDDQ
建议每颗 DRAM 平均 15uF
应尽可能靠近 DRAM VDDQ 焊球。
VIN_BULK
PMIC 输入附近:8 颗 22uf, 4 颗 0.1uF   CAMM2 
连接器 VIN_BULK 引脚附近:6 颗 0.1uF
 

1. VDD, VDDQ 和 VPP 的去耦电容值因模组而异,并可能交错以实现最佳的整体阻抗 vs 频率响应。

2. VDD, VDDQ 和 VPP 的推荐去耦值为 1uF, 22uF, 4.7uF 和 10uF。

3. 根据 DRAM 封装尺寸,可能无法实现所有布局。

4. 有关 PMIC 芯片周围去耦的详细信息,请参阅 PMIC 规格。

 

 
文中的部分图片和内容引用自 Charlene McCauly 以及 Terrie Duffy 的 “设计者眼中的 DDR5” 报告。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.dodopcb.com/ziyuan/266.html