在开始前,要先明确一点:在这四个名词概念中,PCM与PDM指的是”编码方式“(数字音频的表示方法),而I2S与TDM则指的是“传输协议”(数字音频的传输规则)。
PCM
PCM介绍
脉冲编码调制(英语:Pulse-code modulation,缩写:PCM)是一种模拟信号的数字化方法。PCM将信号的强度依照同样的间距分成数段,然后用独特的数字记号(通常是二进制)来量化。PCM常用于数字电信系统上,也是电脑和红皮书中的标准形式。在数字视频中它也是标准,例如使用 ITU-R BT.601。
——引用自Wiki
但是PCM并不流行于诸如DVD或DVR的消费性商品上,因为它需要相当大的比特率(DVD格式虽然支持PCM,不过很少使用);与之相较,压缩过的音频较符合效率。不过,许多蓝光光盘使用PCM作音频编码。非常频繁地,PCM编码以一种串行通信的形式,使数字传讯由一点至下一点变得更容易——不论在已给定的系统内,或物理位置。
PCM 是最基础的数字音频编码方式,几乎所有数字音频的处理、存储、传输都以它为核心。
PCM定义
PCM是一种将模拟音频信号(如声音的振动)转换为数字信号的编码方式:
- 采样:按固定频率(采样率,如 44.1kHz)对模拟信号的幅度进行 “快照”;
- 量化:将每个采样点的幅度用固定位数的二进制数表示(量化位数,如 16bit、24bit、32bit);
- 编码:将量化后的二进制数按顺序排列,形成数字数据流。
例如,CD 音质的音频就是 “44.1kHz 采样率 + 16bit 量化” 的 PCM 数据,存储为 WAV 文件时本质就是 PCM 流。
而我的VDS设计中,无线输出的音频数据就是48kHz采样率 + 24bit 量化 + 3通道的PCM数据流。
在下图中,可以简单看到PCM编码的运作方式:按固定采样频率,在每个时间节点将音频的大小的模拟数据转化为数字数据,并且按顺序排列,而量化位数越高,则每次采样所转化的数字数据越准确。

图1 PCM编码方式,来自Wiki
PCM特点
- 普适性:几乎所有数字音频设备(如 DAC、ADC、播放器)都支持 PCM;
- 数据格式:每声道数据 = 采样率 × 量化位数(如 44.1kHz×16bit=705.6kbps / 声道,双声道则翻倍);
- 缺点:需要 ADC(模转数)进行量化,电路复杂度中等。
PDM
PDM介绍
脉冲密度调制(英语:Pulse Density Modulation,PDM)是一种二进制信号的模拟信号调制方法。在PDM信号中,脉冲的相对密度对应模拟信号的幅度,并不像脉冲编码调制(PCM)中那样,特定的幅度值不被编码成不同权重的脉冲码。1位DAC的输出与信号的PDM编码相同。
——引用自Wiki
脉冲宽度调制(PWM)是PDM的一种特殊情况,其中开关频率是固定的,并且对应于一个样本的所有脉冲在数字信号中是连续的。对于分辨率为8位的50%电压,PWM波形将打开128个时钟周期,然后在剩余的128个周期内关闭。利用PDM和相同的时钟速率,信号将在每隔一个周期的开启和关闭之间交替。两种波形的平均值均为50%,但PDM信号更频繁地切换。对于100%或0%的水平,它们是相同的[1][2][3]。
PDM 是另一种数字音频编码方式,与 PCM 并列,核心是用 “脉冲密度” 表示模拟信号的幅度。
既然此处Wiki提到了PWM,那就顺带讲解一下PDM与PWM的关系:
PDM与PWM
PWM(Pulse Width Modulation,脉冲宽度调制)和 PDM(Pulse Density Modulation,脉冲密度调制)同属脉冲调制技术,核心都是通过 “脉冲信号” 传递信息,因此在原理和应用场景上有一定关联,但本质上是两种不同的调制方式。
两者共同点
- 两者均为脉冲调制
两者都用 “脉冲的特征变化” 表示模拟信号的幅度:- PWM 通过脉冲宽度(占空比)的变化传递信息;
- PDM 通过单位时间内脉冲数量(密度)的变化传递信息。
- 两者可用于模拟信号的数字化表示
都能将连续的模拟信号(如音频、电压)转换为离散的脉冲流,因此常被用于低成本的信号传输或转换场景(如音频输出、电机控制)。
两者核心差别
| 维度 | PWM(脉冲宽度调制) | PDM(脉冲密度调制) |
|---|---|---|
| 核心特征 | 脉冲宽度随信号幅度变化(占空比 = 信号幅度比例) | 单位时间内脉冲数量随信号幅度变化(密度 = 幅度) |
| 脉冲频率 | 固定(如 20kHz),脉冲间隔均匀 | 不固定(通常高频,如 1-32MHz),脉冲间隔可变 |
| 示例 | 模拟信号幅度为 50% → 脉冲占空比 50%(如 10ms 脉冲 + 10ms 空闲) | 模拟信号幅度为 50% → 100 个周期内 50 个脉冲 |
| 频谱特性 | 主要能量集中在调制频率的谐波处,需低通滤波抑制高频噪声 | 能量分布较分散,需抽取滤波转换为 PCM |
| 典型应用 | 电机调速、LED 调光、D 类功放(直接驱动扬声器) | MEMS 麦克风输出、低成本音频采集(需转 PCM 处理) |
- PDM:主要用于音频采集(如 MEMS 麦克风直接输出 PDM 信号,需通过芯片转换为 PCM 后才能被播放器处理);
- PWM:主要用于音频输出(如 D 类功放将 PCM 信号转换为 PWM 脉冲,直接驱动扬声器,省去数模转换环节,效率更高)。
可以在下图中看到二者的区别处:


图2与图3 PDM编码方式,来自Wiki

图4 PWM编码方式,来自kebamerica.com
PDM定义
- 模拟信号幅度越高,单位时间内的脉冲数量(密度)越大;
- 无需量化为固定位数的二进制数,直接输出高频脉冲流(通常 1-32MHz);
- 例如:模拟信号为正峰值时,脉冲占空比接近 100%;负峰值时接近 0%;零电平时约 50%。
PDM特点
- 低成本:MEMS 麦克风等设备可直接输出 PDM,无需复杂 ADC(PCM 需要 ADC 量化);
- 高采样率:脉冲频率通常为 MHz 级(如 1MHz),远高于 PCM 的 44.1kHz/48kHz;
- 需转换为 PCM:PDM 无法直接用于多数音频处理(如播放、存储),需通过 “抽取滤波”(Decimation Filter)转换为 PCM(例如将 1MHz PDM 转为 48kHz 16bit PCM);
- 应用场景:MEMS 麦克风(手机、耳机)、低成本音频设备。
I2S
I2S介绍
I2S (Inter-IC Sound,集成电路间音频接口)是由飞利浦定义的,专门用于传输 PCM 数据的短距离传输协议,主要用于芯片级通信(如 MCU 与 DAC、ADC 之间)。
I2S核心作用
解决 PCM 数据在设备间传输时的 “同步” 和 “声道区分” 问题。
I2S信号组成(典型 4 线制)
- SCK(Serial Clock,串行时钟;亦称BCLK,即位时钟 Bit Clock):数据传输的节拍时钟,频率 = 采样率 × 量化位数(如 16bit×44.1kHz=705.6kHz);
- WS(Word Select,声道选择;亦称FSYNC,即帧同步 Frame Synchronous):区分左 / 右声道的同步信号(低电平 = 左声道,高电平 = 右声道),频率 = 采样率(如 44.1kHz);
- SD(Serial Data,串行数据):传输 PCM 数据(高位在前,低位在后);
- MCLK(Master Clock,主时钟):用于设备内部时钟同步(可选,通常为采样率的 256/384 倍,如 44.1kHz×256=11.2896MHz)。
I2S特点
- 双声道为主:原生支持左 / 右双声道,多声道需扩展;
- 短距离:仅限芯片间(如 PCB 板上),传输距离通常 < 1 米;
- 应用场景:消费电子(耳机、蓝牙音箱、声卡)中 DAC 与处理器的通信。
TDM
TDM(Time Division Multiplexing,时分复用接口) 是基于 PCM 的多声道复用传输协议,通过 “时间分片” 在同一总线上传输多个声道的 PCM 数据。
TDM核心原理
将时间划分为 “帧”(Frame),每个帧包含多个 “时隙”(Slot),每个时隙对应一个声道的 PCM 数据。例如:一个帧周期内,第 1 个时隙传左前声道,第 2 个传右前声道,第 3 个传中置声道…… 以此实现多声道复用。
TDM信号组成(典型 3 线制)
- CLK(时钟):数据传输的节拍时钟(同 I2S 的 SCK);
- FS(Frame Sync,帧同步):标记帧的起始(频率 = 采样率),每个 FS 脉冲后开始一个新帧;
- DATA(数据):串行传输的多路 PCM 数据(按时隙顺序排列)。
TDM特点
- 多声道支持:可传输 8/16/32 声道(取决于时隙数量),远超 I2S 的双声道;
- 高效布线:用 1 组线传输多路 PCM,减少设备间连线(如汽车音响有 10 + 扬声器,用 TDM 可简化布线);
- 应用场景:专业音频设备(调音台、多轨录音机)、汽车音响(多扬声器系统)、智能家居(多房间音频)。
参考资料
脉冲编码调制——维基百科
脉冲密度调制——维基百科
脉冲宽度调制——维基百科
I²S——维基百科
时分多路复用——维基百科
感谢豆包AI的统计整理

Comments NOTHING