本文分享译自 bloggeek博客创始人 Tsahi Levent-Levi。以下是 2024 年的 WebRTC 趋势和预测。它们延续了我们在 2023 年看到的趋势,但也有一些变化。
是时候回顾一下我们在 2023 年取得的成就,并思考一下 2024 年我们在 WebRTC 方面的前景了。
展望未来,有几件值得注意的事情让我们眼前一亮:
- WebRTC 将继续存在。但在某些情况下和某些用例中,重点正在转向 WebTransport+WebCodecs+WebAssembly
- 经济衰退已经来临,而且不会消失,所以我们一年前看到的情况仍在继续
- 生成式人工智能(Generative AI)备受青睐和关注。它也慢慢进入了 WebRTC 服务领域。
去年,我成为 Spearline 的首席运营官。今年,Spearline 被 Cyara 收购,我现在是那里的产品管理高级总监。我仍在深入研究 WebRTC 和 CPaaS。如果有必要,我还会就这些主题提供一些咨询。
WebRTC 的差异化时代
我们已经进入了差异化时代:
我曾在 2020 年的某个地方做过这张幻灯片,后面做了一些修改。
它在今天和去年一样具有现实意义:
- 我们一开始只是探索性地使用 WebRTC,问自己是否应该使用这项技术?
- 然后我们看到了一个增长高峰,很明显 WebRTC 将继续存在。问题变成了我们如何使用它
- 这让我们进入了差异化时代,不同公司的服务看起来如此相似,使用相同的 WebRTC 界面和功能,以至于我们现在要问自己,我们该如何竞争?
关于如何竞争,每年的答案都不尽相同。现在,它显然围绕着生成式人工智能和 LLM。这是一个简单的答案。事实却要复杂和微妙得多,这需要了解目前的投资方向——无论是在谷歌还是在围绕 WebRTC 及其使用的生态系统中。
WebRTC 的使用情况如何?
去年,我预测使用量将比大流行前高 3 倍。这意味着 2023 年初的使用量将从大流行前的 4 倍降至 3 倍。最终结果如何?我们的用量保持在大流行前的 4 倍左右。
从这里开始,使用量只能缓慢直线上升,但很可能在 2024 年之后:
- 新的使用案例不太可能导致人们开始进行更多的视频通话
- 未来的增长将来自于将本地解决方案转变为云解决方案,同时迁移到 WebRTC 的使用上
WebRTC、开源和 XaaS
在这里,我不想谈开源的话题。两周前,我曾在文章中介绍过 github 上的顶级 WebRTC 开源媒体服务器。
XaaS 需要解释一下,我可能会在未来几个月的另一篇文章中进一步详细介绍。
对我来说,XaaS 就是 IaaS、CPaaS 和 SaaS。在所有情况下,都需要从 WebRTC API 到 CPaaS 的角度来看待它们。
CPaaS
CPaaS 领域的格局正在发生变化。几年前,WebRTC API 的主要供应商是 Vonage、Twilio 和 Agora。大概是按照这个顺序排列的。
以下是我在去年预测文章中的观点:
WebRTC CPaaS 的公认领导者仍然是 Twilio、Vonage 和 Agora。我有一种预感,到 2023 年底,这种情况将会改变。
没想到,我的预测是正确的……
Twilio 刚刚在 12 月宣布完全退出视频业务。他们仍然拥有和使用 WebRTC 语音功能,主要集中在呼叫中心。但除此之外呢?对于许多开发人员来说,他们已经变得无关紧要了。
现在,大多数供应商可能都想将自己与 Vonage 和 Amazon Chime SDK 相提并论。Agora 可能也是如此。
从创新或特定利基市场的角度来看,我想到了其他供应商作为可靠的替代品。例如 Daily 和 Dolby(还有其他公司,抱歉没有一一提及)。或者 LiveKit 的开源替代方案。
值得注意的公司?
- Twilio 在一年前几乎退出了市场,将重心转移到语音和文本联络中心以及 CDP 上。2024 年 12 月,他们宣布停止 Twilio 可编程视频服务。
- Vonage 一直致力于将机器学习管道集成到其 SDK 中,这非常好
- Dolby 加倍努力满足低延迟流媒体和高端音频需求
- Daily 在低代码方面处于领先地位,并且在过去的一年中一直非常关注人工智能和合作伙伴关系
- Agora 刚刚发布了信令 SDK 并引入了 VP9 支持
Twilio 的这一变化给开发人员带来了更大的压力,他们需要选择使用谁的产品,而他们所选择的 CPaaS 供应商的承诺水平又给他们带来了新的风险。当像 Twilio 这样的公司让你蒙受损失时,你还能指望其他供应商做什么呢?
译者注:除作者提到的这些海外公司外,2024年将是国内厂商发力(或更激进)海外的一年。像腾讯、声网、ZEGO即构科技、火山引擎以及网易云信等,音视频海外赛道将迎来更”卷”的局面,对出海企业来说更是一种利好吧。
SaaS
SaaS 供应商正争先恐后地向 CPaaS 转型,不知出于什么原因,他们认为可以从开发人员那里赚到钱。
走这条路的不在少数。
我看到的问题是,Twilio 认为这还不够有趣。虽然他们拥有 API,但却没有进一步投资。这意味着对 Twilio 来说,这个市场还不够大。在这样的氛围下,SaaS 厂商又怎么会有足够大的市场呢?他们又怎么会看到他们的基础设施的爆炸式增长呢?
他们中的一些可能会成功,但道路并不明显或简单。
IaaS
亚马逊、微软、谷歌……还有 Cloudflare。
- 亚马逊有 AWS Chime SDK
- 微软有 Azure 通信服务
- 谷歌……没有
- Cloudflare 在 2023 年推出了 WebRTC 服务
让我们拭目以待。
亚马逊正在投资 Chime SDK。尤其是在音频质量和功能方面。在许多方面,亚马逊正在将开发人员的注意力从 CPaaS 转移到 Chime SDK 上,将其作为一种可靠的替代方案。CPaaS 供应商和开发人员都应关注这一趋势。
微软似乎对其目前提供的 Azure 通信服务感到满意。2023 年没有围绕它发布任何新的或有趣的公告,这就引出了一个问题–它对微软是否足够重要,对开发者是否是一个可行的解决方案?
谷歌公布了 Google Meet 的 API。这些 API 与 Google Meet 集成,但不能使用 Google Meet 的基础架构来构建我自己的视频体验。因此,CPaaS 的前景并不乐观。时间会证明这种情况是否会改变。这种情况不太可能在 2024 年发生。
Cloudflare 大张旗鼓地进入市场,我在 2023 年的预测中对其进行了报道。从那时起,他们就没有发布过任何重大消息。这是好事吗?还是不好?我也不知道。
我对 2023 年 WebRTC 的预测结果如何?
我在 2023 年的预测上花了不少时间。让我们看看我做得怎么样。
1. libWebRTC(以及 WebRTC 的未来)
我曾预测,谷歌的 WebRTC 库将专注于内部清理、优化和完善协作。今年它做到了这一切,我们在 WebRTC Insights 服务中持续看到了这一点。
值得注意的是,Google Meet之外的需求略有变化。只要 H.265 能以硬件形式实现(即已经有人在支付专利使用费),就会在 libWebRTC 中加入对 H.265 的支持。
是因为谷歌仁慈善良吗?是因为他们想表明自己并不是 Chrome 浏览器的垄断者吗?是因为与英特尔(将 H.265 引入 WebRTC 的公司)达成了其他协议?还是仅仅因为他们最终可能会在全苹果设备的会议中使用 Google Meet?时间会证明一切。
2. 机器学习和媒体处理
我以为 WebAssembly 将继续与 WebRTC 一起用于媒体处理,如背景替换、噪音抑制和专有编解码器的实现。
的确如此。
其中一些是在 WebAssembly 和浏览器层面完成的。很多工作都被放到了云端或本地应用程序中。我发现有趣的是,一些厂商选择在所有平台上宣布并发布此类解决方案,而不是先从本地平台开始,然后再转向网络。
这里最有趣(也最明显)的变化是什么?现在,很多这种应用都被重新推销为生成式人工智能——是否是生成式的并不重要。
3. 先语音后视频(先 Lyra 后 AV1)
我以为 Lyra(=新语音编解码器)会比 AV1(=新视频编解码器)更快进入应用程序。或者至少是新的语音编解码器…
结果……没有定论。
Webex 确实推出了新的 Webex AI 音频编解码器,但对其解释不多。
AV1 开始真正发出接近成熟的声音,苹果支持 AV1 硬件加速(目前仅用于解码),谷歌也在 Google Meet 中尝试使用 AV1。
今年,我们没有听到太多关于谷歌 Lyra 或微软 Satin 编解码器的消息。只有这次新发布的 Webex AI 编解码器。因此,我不确定语音是否先于视频出现。
4. 可观察性
是的,人们对可观察性更感兴趣。我是通过观察我们在 testRTC 中的数据了解到这一点的。没有哪个特定市场或行业对可观察性更感兴趣。我可以说的是,许多联络中心开始注意到这一点。这可能是因为他们越来越依赖 WebRTC,而且许多联络中心的座席现在都在家工作。
5. 并购和关闭
我们经历了一些有趣的停产和并购。其中最引人注目的是?
- Omegle 关闭
- Verizon 关闭 Bluejeans
- Hopin 分拆,将 “Hopin “卖给 RingCentral,保留 StreamYard
- Twilio 关闭 Twilio Programmable Video, Jeff Lawson 成为 Twilio 前首席执行官。
- Spearline 被 Cyara 收购。不一定是因为 WebRTC
很多 WebRTC 工程师都找到了自己的新家。要么是因为他们的初创公司倒闭了,要么是因为他们的公司缩减了规模,要么是因为他们在原来的地方看不到未来。
2024 年 WebRTC 预测
1. libWebRTC(以及 WebRTC 的未来)
我将从我们的技术拼图中最重要的一块开始——由谷歌维护的 libWebRTC。
今年将是去年的延续。主要是维护性发布,以及一些小的改进。在 libWebRTC 中,我们将看到 Google 最关注的地方:
- 通过 Insertable Streams 访问原始和编码的媒体帧。这将包括优化和更大的灵活性。这一切的目的都是为了促进和推动人工智能功能的发展
- 协作。这是去年的延续。其中一些是通过可插入流实现的。还有一些则是通过完善浏览器中的媒体控制 API 来提升用户体验。
- 适应 AV1。我相信,到 2024 年底,我们将最终看到 Google Meet 使用 AV1–我们刚刚看到了曙光。在一些有限的场景中,在选定的设备类型上。此外,我们还在努力通过硬件加速实现 VP9 同步广播,而不是使用 VP9 SVC。
- 语音人工智能。谷歌将在 Google Meet 中加入 Lyra 或类似功能。它可以是独立的,也可以通过某种方式将其插入 Opus 或类似系统中。也许它会通过可插入流来实现,但我怀疑他们会采用这种方式。
到 2024 年底,我们会发现自己的情况与开始时类似:
- 谷歌将成为 libWebRTC 的主要和几乎唯一的贡献者。提交总数一直在减少,这种情况还将继续。我们会在 2024 年看到它趋于稳定吗?
- 外部贡献会时有发生。其中大部分可能来自 Philipp Hancke 。但在这里,我们可能已经看到了个人贡献的顶峰……
2. 机器学习和媒体处理
WebAssembly 是我们看到 WebRTC 创新和差异化的地方。2024 年也不会例外。
它将被纳入媒体处理的 “老地方”。
我们还将在服务器端看到更多的机器学习,其中很多将倾向于生成式人工智能和 LLM 技术。这并不是一个真正的预测,而只是在这里说明一个显而易见的事实。对于一个用 Midjourney 撰写了许多近期图像文章的人来说,这应该不会让你感到意外。
3. Lyra 和 AV1 年
是时候冒一次巨大的风险了。
我在 libWebRTC 预测中提到过这个问题,但它也值得单独写一节。
每年我都说 AV1 还需要几年时间。我认为,要普及 AV1 仍需时日。尽管如此,我相信今年我们会在一个或多个商业 WebRTC 服务中看到 AV1,包括 Google Meet。它将被谨慎地应用于非常特殊的使用案例和场景中,我们称之为试水。
在音频方面,我们将看到人工智能音频编解码器被用于网络浏览器的生产中。这很可能来自谷歌。我相信 Lyra 会进入 Google Meet。具体如何,我还不确定。
4. WebTransport 作为真正的替代方案
WebTransport 诞生于 2020 年,现在已经是 2024 年初了。
并非所有浏览器都能使用它,Safari 浏览器就不支持它。它在其他浏览器中也能使用,但远未得到普遍使用,也未进入主流思维。
今年,我们又看到了一些使用 WebTransport 进行的实验和概念验证,这些实验和验证结合了低延迟媒体传输技术。这些实验和概念验证主要集中在流媒体领域。这是有原因的。在讨论 WHIP 和 WHEP 时,我曾写过这方面的文章。
以下是我认为将要发生的事情:2024 年,我们将看到首个可投入生产的低延迟流媒体解决方案,它使用的是 WebTransport 而不是 WebRTC 或其他技术。这将适用于单向大规模广播使用案例,延迟 1-2 秒即可。
也会有人将 WebTransport 用于双向媒体传输,类似于 Zoom 在Web浏览器中的做法,但这只是例外情况,更多的是一种尝试。
5. 并购和关闭
这在 2023 年很容易实现,在 2024 年仍将如此。
经济衰退已经到来。衰退可能会持续到 2024 年,看不到真正的尽头,至少现在还没有。
更多依赖 WebRTC 的供应商将倒闭。小型初创企业将力不从心。大型供应商可能会决定退出这一市场,专注于开展业务的其他途径。
关闭可能意味着被收购,或者以低廉的价格被收购。也可能意味着将大块业务出售给另一家公司。
坚守这一市场的供应商可能会放慢全年的努力步伐,以求生存并经受住这场持续的风暴。
2024年,我们来了
2024 年要做的事情很多,但资源有限:
- 放缓的同时,我们看到了技术的转变和差异化的需求
- 生成式人工智能和一般人工智能,并尝试找出其在 WebRTC 用例中的适用位置
- 完善 WebRTC 中的协作和共享功能,并将其应用到应用程序中
- 引入下一代音频和视频编解码器
- 研究新的传输技术
所有这一切,都是为了满足用户和客户对新功能和新版本的需求。
原文:https://bloggeek.me/webrtc-predictions-2024/
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/webrtc/41529.html