IP网络上的语音与视频通信

mazhu • 2025年3月21日上午11:24 • 实时音视频

IP网络（如互联网）具有独特特性，这些特性对实时媒体通信构成了挑战：

丢包：IP网络可能因拥塞、缓冲区溢出或物理层错误随时丢弃数据包
- 典型丢包率：互联网骨干网<1%，边缘网络1-5%，无线网络5-10%或更高
- 丢包模式：常见随机丢包和突发丢包两种模式
抖动：数据包到达时间的变化，有时称为延迟变化
- 原因：竞争网络资源、路由变化、队列延迟等
- 影响：播放中断、音质下降、视频卡顿
延迟：从发送端到接收端的传输时间
- 组成部分：传播延迟、队列延迟、处理延迟、序列化延迟
- 交互应用延迟上限：约150-200毫秒（超过会影响用户体验）
乱序：数据包可能按不同于发送顺序的顺序到达
- 原因：IP网络的路由动态变化
- 需要：重排序缓冲和序列号跟踪机制
带宽限制：不同网络链路提供不同带宽
- 瓶颈：通常在网络边缘（最后一公里）
- 竞争：与其他应用共享带宽

实时音视频应用对网络有特殊需求：

音频：
- 语音编码：可容忍1-5%随机丢包
- 音乐编码：通常需要<1%丢包率
- 特点：短时间丢包可被人耳掩盖
视频：
- 关键帧：几乎不能容忍丢失（会导致长时间画面损坏）
- 非关键帧：可容忍一定丢失（只影响部分画面或短时间）
- 特点：视觉感知对某些区域（如人脸）的损坏更敏感