音视频直播技术的现状
从直播服务端的角度看,随着时代的发展、技术的进步,单纯的实时互动直播或娱乐直播已经不能满足人们的日常需求了。以在线教育为例,它既要求老师与学生之间可以进行实时互动以增强教学的质量,又需要让更多的(尤其偏远地区的)学生可以听到优质的课程。因此,实时互动直播与娱乐直播技术相结合成为现在直播服务器的主流技术方案。
从直播客户端的角度看,虽然音视频技术已经很成熟,允许我们自研音视频会议产品,但自研这种产品费用十分昂贵。而Google帮我们解决了这个问题,2011年Google花了6000多万美元收购GIPS公司(它也是一家从事音视频实时互动引擎开发的公司,在音频编解码、网络传输等方面,有很多的技术积累和非常大的技术优势),并将其技术重新组织,开源成为现在的WebRTC。
WebRTC的愿景是让浏览器间可以快速、方便地实现端到端的实时音视频互动。随着这几年WebRTC技术的演进,以及WebRTC1.0规范的推出,在浏览器间进行实时音视频互动已成为可能。目前主流的浏览器(Chrome、Firefox、Safari、Edge)都已支持WebRTC,其愿景已初见成效。一旦这一愿景全部实现,它必将对人类产生巨大的影响。我们可以想象一下,未来我们只要通过浏览器就可以与全世界几十亿的人随时随地地实时沟通,这是多么震撼的场景!
此外,WebRTC不仅可以用在浏览器之间进行音视频互动,它还可以应用在非常广泛的产品上,如P2P传输、文本聊天、文件传输、游戏、多人实时互动、音频处理(回音消除、降噪)等各种各样的应用中,甚至是人工智能软件上。
正是看到WebRTC如此强大,各大公司现在都开始引入、拥抱WebRTC。目前做音视频相关产品的公司或多或少都参考或借鉴了WebRTC,甚至有些公司完全使用WebRTC来研发产品。
比如阿里、腾讯就在使用WebRTC技术替换自己的CDN直播网络。现在在它们的一些实验产品中,已经可以使用RTMP推流,然后在浏览器上使用WebRTC技术拉流观看了。这种技术对于视频监控行业来说应该是一个特别好的解决方案。由此可见,音视频直播技术有两个重要趋势:一是实时互动直播技术与娱乐直播技术合二为一;二是WebRTC已经是直播技术的标准,大家都在积极地拥抱WebRTC。
音视频直播技术的未来
随着5G的发展,我们可以预见未来5∼10年,音视频直播一定会从一个小众技术逐渐发展成像云主机一样的基础服务。另外它还会与其他技术如AI、深度学习、大数据等融合,这种融合一旦成熟,必将给整个世界带来巨变。
我们都知道,音视频中存在着非常丰富的信息,如人的面部表情、动作、物体、环境等,但由于音视频属于非结构化数据,在没有AI、深度学习之前,人们除了可以用眼看、用耳听之外,别无他法,只能眼睁睁地看着它们浪费掉。但现在不一样了,有了AI、深度学习技术,我们可以利用它们对音视频数据做二次处理,将这些非结构化的数据转变成结构化的数据(存入数据库或保存成格式化文件),之后再利用大数据技术对它们进行分析,生成各种报表,从而为你的业务提供支持和服务。音视频技术、AI、深度学习以及大数据技术就像魔法药水中的各种成分,只要将它们混合在一起,就可以变换出各种神奇的效果。
当然,如果可以再进一步,将AI和大数据分析速度提升到实时处理的级别,让产品可以根据视频中用户的面部表情、行为举止实时改变服务的内容,如老师在线授课时,可以实时提供每个学生听课的专注程度等,从而让老师可以适当调整讲课的节奏,提高学生的成绩,这样的产品才是更奇妙的。相信在不久的将来一定可以做到这一点。
此外,前文已经介绍过,WebRTC目前已经成为音视频实时通信的标准,而它与浏览器是深度绑定的,因此未来浏览器的功能会越来越强大,强大到我们在终端上不需要安装任何其他软件,只要有一个浏览器就可以完成我们所有的日常工作。这在几年以前还是不可想象的事情,但现在这种趋势已经越来越明显了。
节选自李超《WebRTC音视频实时互动技术》,仅作为学习参考用,转载请注明。
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。