技术文章
-
DiffPoseTalk:利用扩散模型进行语音驱动的风格化 3D 面部动画和头部姿势生成
通过语音驱动的风格化3D面部动画生成需要学习语音、风格和相应的面部运动之间的多对多映射关系。然而,现有方法要么使用确定性模型进行从语音到运动的映射,要么使用一种独热编码方案来编码风…
-
Janus 与 MediaSoup:选择 WebRTC 服务器的终极指南
在构建实时多媒体应用时,服务器技术的选择至关重要。该领域的两大巨头是 Janus 和 MediaSoup,它们都支持 WebRTC 功能,但采用的方式截然不同。本综合指南旨在深入探…
-
Gossip协议在社交媒体网络中的应用:Instagram 及其他
Gossip协议是分布式系统中的一种通信方案,用于在节点间有效传播信息。它的灵感来源于人们闲聊的方式,即通过一系列闲聊来传播信息。本文将详细讨论Gossip协议,并介绍其在社交媒体…
-
Pushpin:利用 WebSockets 优化实时通信
在快节奏的实时通信世界中,对客户端和服务器之间高效可靠连接的需求从未如此之高。Pushpin 是一种反向代理,可充当重要的中间人,专门处理 WebSockets 和服务器发送事件等…
-
探索Media Streams API: 深入了解Web上的实时音频和视频处理
大家好。你们经常在网站上使用摄像头或麦克风吗?或者,作为用户,你们自己也使用过?今天我们就来谈谈如何使用它以及它可能带来的问题。 在谈到网站使用用户设备时,我们需要考虑以下因素: …
-
利用 WebRTC 增强现代通信与协作的能力
Web实时通信(Web Real-Time Communication),简称 WebRTC,是一种革命性的开源技术,它大大简化了万维网上的实时通信,实现了网络浏览器之间的直接交互…
-
带宽与延迟有什么区别(带宽和延迟的概念)
在数字时代,流媒体体验的质量往往取决于两个关键的网络性能指标:带宽和延迟。要了解互联网连接及其处理数据的能力,这些术语不可或缺。然而,许多人仍然对这些概念感到困惑。了解它们如何全面…
-
邻域感知的分布式智能边缘计算卸载和资源分配算法 | 重庆邮电大学李云、夏士超等
研究意义 随着大量计算密集型和时延敏感型任务的出现,利用移动边缘计算(mobile edge computing, MEC)来提高用户体验并降低系统能耗成为研究热点。然而,在密集部…
-
如何大规模实施 HLS/DASH 内容转向 | IBC2023技术论文
IBC2023: 本技术论文介绍了内容转向技术、其优势、挑战、如何应对这些挑战以及系统的功能。 内容摘要 内容转向技术是 HLS 和 MPEG DASH 标准最近新增的一项技术,可…
-
AVS3 中的 DMVR 技术
AVS3中引入了解码端运动矢量修正(DMVR,Decoder side Motion Vector Refinement)技术,AVS3中的DMVR技术和G.266/VVC类似,它…
-
网易云信音视频处理引擎最佳实践
导读:随着 RTC 技术的广泛应用以及场景不断丰富,越来越多的音视频特性加入到 RTC 中,这也带来了一些问题:1. RTC SDK 包体积不断增大;2. 开启音视频特性导致在中低…
-
音视频编解码–H264 帧内预测
帧内预测 最近看书学习过程中做了一些笔记,分别和大家一起分享一下,今天首先分享的是H264的帧内预测。 H.264/AVC 标准中规定的 4×4 亮度块的帧内预测样本预测…
-
确保Kamailio通过HTTP传输的JSON-RPC安全
我在上一篇文章中介绍了 Kamailio 的 JSCON-RPC over HTTP,旨在介绍 RPC 的使用方法,但被指出不安全且不适合生产。现在,让我们看看如何纠正这一问题。本…
-
Kamailio RPC over HTTP 简介
简介 本文是关于如何通过 HTTP 在 Kamailio 上设置和使用 RPC 的基本概述。由于本示例极不安全,因此绝对不能在生产中使用。下一篇文章将介绍如何正确确保示例安全,以便…
-
基于多视图消息认证的鲁棒多智能体协作 | 南大袁雷、俞扬等
研究意义 多智能体强化学习近年来在多个领域取得快速发展及诸多傲人的成果,智能体通过与环境进行交互逐步优化,最终得到最优的策略。其中,多智能体协作凭借其在真实应用场景中的常见应用最近…
-
挑战十万在播–直播全量在播分发系统
先说明下什么叫“全量在播”,指的是直播范围内,当前所有在线主播的信息,尤其是主播的房间id和uid,对于很多上游业务来说,是必要的数据,是业务逻辑的数据基础。 直播之前虽然有一套这…
-
云化XR和沉浸式全息交互技术的探索与思考
编者按:计算机图形与仿真技术的发展为人类带来了众多的沉浸式技术。虚拟现实(VR)、增强现实(AR)、混合现实(MR)等技术通过不同程度数字信息与现实环境的融合,为用户带来了全新体验…
-
单通道语音唤醒与语音增强结合时的性能变化
单通道语音唤醒常应用于TWS耳机、智能手表等边缘设备上,作为语音助手的“守门员”。各信噪比下的唤醒率、每日误唤醒、唤醒延迟、模型参/算量是衡量语音唤醒算法性能的若干关键指标。低信噪…
-
怎样查看macOS支持的硬件编解码器信息
已知macOS支持H.264和H.265编解码器,但是像VP9在某个设备上是否支持未知。很奇怪macOS上找不到一个现成的工具,能够查看支持哪些视频编解码格式。于是我翻了一通App…
-
5G高密重载场景ToB/ToC组网策略研究 | 王蕾、曾伟等
摘要:为满足冬奥高密重载组网需求,利用国家体育场环境实施空频多维度5G立体组网、精细容量规划、精准区域覆盖,并在全场景应用分布式大规模天线技术、端到端5G切片技术、载波聚合、超级上…