IP网络上的语音与视频通信

IP网络(如互联网)具有独特特性,这些特性对实时媒体通信构成了挑战:

基本特性

  1. 无连接性:IP网络提供无连接服务,每个数据包独立路由
  2. 最佳努力服务:没有服务质量保证,只提供尽力而为的交付
  3. 分布式控制:网络控制分布在各个节点,没有中央控制机构
  4. 可扩展性:设计用于支持全球范围内的扩展

性能特征与挑战

  1. 丢包:IP网络可能因拥塞、缓冲区溢出或物理层错误随时丢弃数据包
    • 典型丢包率:互联网骨干网<1%,边缘网络1-5%,无线网络5-10%或更高
    • 丢包模式:常见随机丢包和突发丢包两种模式
  2. 抖动:数据包到达时间的变化,有时称为延迟变化
    • 原因:竞争网络资源、路由变化、队列延迟等
    • 影响:播放中断、音质下降、视频卡顿
  3. 延迟:从发送端到接收端的传输时间
    • 组成部分:传播延迟、队列延迟、处理延迟、序列化延迟
    • 交互应用延迟上限:约150-200毫秒(超过会影响用户体验)
  4. 乱序:数据包可能按不同于发送顺序的顺序到达
    • 原因:IP网络的路由动态变化
    • 需要:重排序缓冲和序列号跟踪机制
  5. 带宽限制:不同网络链路提供不同带宽
    • 瓶颈:通常在网络边缘(最后一公里)
    • 竞争:与其他应用共享带宽

媒体通信的需求与性能指标

实时音视频应用对网络有特殊需求:

延迟容忍度

应用类型可接受的单向延迟说明
交互式音频通话<150ms超过会影响交互质量
视频会议<200-250ms视频可接受略高延迟
直播流媒体<10秒只需保持相对实时性
点播媒体几分钟至几小时缓冲可大幅降低延迟要求

丢包容忍度

  1. 音频
    • 语音编码:可容忍1-5%随机丢包
    • 音乐编码:通常需要<1%丢包率
    • 特点:短时间丢包可被人耳掩盖
  2. 视频
    • 关键帧:几乎不能容忍丢失(会导致长时间画面损坏)
    • 非关键帧:可容忍一定丢失(只影响部分画面或短时间)
    • 特点:视觉感知对某些区域(如人脸)的损坏更敏感

带宽需求

媒体类型典型带宽需求范围
窄带语音 (8kHz)8-32 KbpsG.729, iLBC, Opus窄带模式
宽带语音 (16kHz)16-64 KbpsG.722, Opus中带模式
全频语音/音乐32-510 KbpsAAC, Opus全带模式
标清视频 (480p)0.5-1.5 MbpsH.264/AVC
高清视频 (720p)1.5-4 MbpsH.264/AVC, VP9
全高清视频 (1080p)3-8 MbpsH.264/AVC, VP9, H.265/HEVC
4K超高清视频15-25 MbpsH.265/HEVC, AV1

传输协议的选择与影响

UDP vs TCP对实时媒体的影响

特性UDPTCP对实时媒体的意义
连接建立三次握手UDP无连接建立延迟
可靠性不保证保证交付TCP的重传会增加延迟
拥塞控制无内置机制有内置机制TCP在拥塞时会降低发送率
顺序保证不保证保证顺序TCP会延迟交付乱序包
头部大小8字节20字节UDP开销更小
流控制TCP可能因流控制而阻塞

结论:大多数实时媒体应用选择UDP作为传输层协议,在应用层(如RTP)处理可靠性、顺序和流控制问题,以获得更低的延迟和更灵活的控制。

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论