IP网络(如互联网)具有独特特性,这些特性对实时媒体通信构成了挑战:
基本特性
- 无连接性:IP网络提供无连接服务,每个数据包独立路由
- 最佳努力服务:没有服务质量保证,只提供尽力而为的交付
- 分布式控制:网络控制分布在各个节点,没有中央控制机构
- 可扩展性:设计用于支持全球范围内的扩展
性能特征与挑战
- 丢包:IP网络可能因拥塞、缓冲区溢出或物理层错误随时丢弃数据包
- 典型丢包率:互联网骨干网<1%,边缘网络1-5%,无线网络5-10%或更高
- 丢包模式:常见随机丢包和突发丢包两种模式
- 抖动:数据包到达时间的变化,有时称为延迟变化
- 原因:竞争网络资源、路由变化、队列延迟等
- 影响:播放中断、音质下降、视频卡顿
- 延迟:从发送端到接收端的传输时间
- 组成部分:传播延迟、队列延迟、处理延迟、序列化延迟
- 交互应用延迟上限:约150-200毫秒(超过会影响用户体验)
- 乱序:数据包可能按不同于发送顺序的顺序到达
- 原因:IP网络的路由动态变化
- 需要:重排序缓冲和序列号跟踪机制
- 带宽限制:不同网络链路提供不同带宽
- 瓶颈:通常在网络边缘(最后一公里)
- 竞争:与其他应用共享带宽
媒体通信的需求与性能指标
实时音视频应用对网络有特殊需求:
延迟容忍度
应用类型 | 可接受的单向延迟 | 说明 |
交互式音频通话 | <150ms | 超过会影响交互质量 |
视频会议 | <200-250ms | 视频可接受略高延迟 |
直播流媒体 | <10秒 | 只需保持相对实时性 |
点播媒体 | 几分钟至几小时 | 缓冲可大幅降低延迟要求 |
丢包容忍度
- 音频:
- 语音编码:可容忍1-5%随机丢包
- 音乐编码:通常需要<1%丢包率
- 特点:短时间丢包可被人耳掩盖
- 视频:
- 关键帧:几乎不能容忍丢失(会导致长时间画面损坏)
- 非关键帧:可容忍一定丢失(只影响部分画面或短时间)
- 特点:视觉感知对某些区域(如人脸)的损坏更敏感
带宽需求
媒体类型 | 典型带宽需求 | 范围 |
窄带语音 (8kHz) | 8-32 Kbps | G.729, iLBC, Opus窄带模式 |
宽带语音 (16kHz) | 16-64 Kbps | G.722, Opus中带模式 |
全频语音/音乐 | 32-510 Kbps | AAC, Opus全带模式 |
标清视频 (480p) | 0.5-1.5 Mbps | H.264/AVC |
高清视频 (720p) | 1.5-4 Mbps | H.264/AVC, VP9 |
全高清视频 (1080p) | 3-8 Mbps | H.264/AVC, VP9, H.265/HEVC |
4K超高清视频 | 15-25 Mbps | H.265/HEVC, AV1 |
传输协议的选择与影响
UDP vs TCP对实时媒体的影响
特性 | UDP | TCP | 对实时媒体的意义 |
连接建立 | 无 | 三次握手 | UDP无连接建立延迟 |
可靠性 | 不保证 | 保证交付 | TCP的重传会增加延迟 |
拥塞控制 | 无内置机制 | 有内置机制 | TCP在拥塞时会降低发送率 |
顺序保证 | 不保证 | 保证顺序 | TCP会延迟交付乱序包 |
头部大小 | 8字节 | 20字节 | UDP开销更小 |
流控制 | 无 | 有 | TCP可能因流控制而阻塞 |
结论:大多数实时媒体应用选择UDP作为传输层协议,在应用层(如RTP)处理可靠性、顺序和流控制问题,以获得更低的延迟和更灵活的控制。
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。