技术文章
-
UniEdit:无需训练的统一视频运动和外观编辑框架
UniEdit是一种无需训练,能同时解决视频运动编辑和外观编辑的统一框架。我们发现,视频模型中的时间和空间自注意力层分别编码帧间和帧内依赖关系。基于这一洞见,为了实现在保留源视频内…
-
AV1 和 VP9 编解码器的选型比较(AV1 和 VP9 的区别)
本文比较了 AV1 和 VP9 这两种免版税的现代视频编解码器。重点介绍了它们的压缩效率、视频质量、硬件支持和采用情况,以帮助读者根据各种情况做出明智的选择。 为什么需要视频压缩?…
-
webrtc推流和拉流是什么意思(webrtc推拉流配置和演示)
WebRTC推流和拉流是什么意思 WebRTC(Web实时通信)是一种用于浏览器之间实时通信的开放标准。WebRTC推流和拉流是指使用WebRTC技术在浏览器中实现音视频流的传输和…
-
Qt C++ | QTimer经验总结
QTimer Class QTimer类提供重复计时器和单次计时器: 定时器信号 void timeout() 公共函数 Qt::TimerType 枚举定义了 Qt 中不同类型的…
-
Meta:通过 AV1 和 HD 为移动 RTC 提供更好的视频质量
过去几十年来,手机摄像头质量和流媒体视频服务的视频质量都有了极大的提高。但是,如果我们看一下实时通信(RTC)应用,虽然视频质量也随着时间的推移而提高,但始终落后于相机质量。 当我…
-
分布式机器学习网络通信优化技术
Ring all-reduce算法被广泛应用在分布式机器学习之中,其同步过程会受到慢节点的影响进而降低整个系统的效率。对Ring all-reduce中的Reduce_Scatte…
-
什么是实时转码?实时转码的原理及解决方案
近年来,由于技术的进步,视频流媒体的格局发生了重大变化。现在,观众希望可以在从智能手机到智能电视等各种设备上访问高质量的视频内容。提供这种无缝体验的核心是视频转码过程,即把视频文件…
-
深度分层视频压缩 | AAAI 2024
最近,直接对连续帧中潜在特征的条件分布进行建模以消除时间冗余的概率预测编码已经产生了有希望的结果。使用单尺度 VAE 的现有方法必须设计复杂的网络来进行潜在空间中的条件概率估计,而…
-
实时传输协议 (RTP)的两大基础设计理念-应用层帧框架和端对端原则,麻省理工两篇论文奠定了RTP的基础
我们讨论RTP传输协议时,首先需要了解此传输规范当初的设计理念或者时间思想,这是任何技术知识框架的基石。针对RTP传输协议,我们需要先了解其两大设计理念,在这个设计理念的基础上,我…
-
FFmpeg音视频解复用+解码
音视频的解复用(Demultiplexing)是一个将单个输入媒体文件分离成不同音频、视频和其他数据流(如果有的话)的过程。这些单独的流之后可以被独立地读取、解码或处理。 FFmp…
-
关于图像过曝问题的排查思路
1、问题背景 读者提问,图像在室外遇到过曝的问题,有什么排查思路和改善方法。 2、问题分析 1)先检查一下sensor驱动,对照 sensor datasheet 确认下最小曝光行…
-
2024年全球互联网通信云(IM+RTC)行业研究报告
全球互联网通信云(IM+RTC)丨研究报告 核心摘要: 最新动态 从应用场景上看:社交娱乐场景融合加速,游戏和社交是场景融合的主要阵地。 从开发者需求上看:1)开发者出海加速,面临…
-
实现 WebRTC 的可观测性
WebRTC 解决方案中经常被低估的一个方面是媒体质量监控。我们需要记住,我们构建实时解决方案不仅仅是为了进行音频和视频通信,而是为了提供尽可能好的体验。为了确保做到这一点,我们需…
-
视频黑屏是什么原因?视频黑屏的解决方法
视频黑屏是音视频应用中一个表示视频无法正常播放或显示的现象。视频黑屏也是实时音视频开发中的一个常见问题。本文将专注于 “视频黑屏” 这一问题,详细分析可能导致此问题的原因,并为开发…
-
10 分钟了解 WebSocket
什么是 WebSocket WebSocket 是一种通信协议,允许客户端和服务器之间通过单个 TCP 连接进行实时数据传输。 WebSocket 就好比您与好友之间畅通的电话线。…
-
FunASR 升级第三代热词方案
在使用语音识别服务进行语音转文字的过程中,大多数情况下模型能正确地预测高频词汇,但是对诸如人名地名、命名实体等词频较低或与用户强相关的词汇,模型往往会识别为一个发音相近的其他结果,…
-
如何克服现场制作中的 5G 容量和延迟问题
将 5G 用于现场制作的主要考虑因素是什么?DPP 的技术专家战略家 David Thompson 为您介绍采用 5G 时的关键要点和潜在隐患。 5G 和向无线制作的过渡被誉为有可…
-
使用 C++ 和 OpenGL 创建 3D 渲染引擎的分步指南
在计算机图形世界中,3D 渲染引擎发挥着至关重要的作用,让虚拟世界栩栩如生。如果您是一名崭露头角的游戏开发人员或图形爱好者,希望深入了解三维渲染世界,那么创建自己的渲染引擎将是一次…
-
实时传输协议 (RTP)收发流程概览-1
因为现在主流的IP网络部署使用SIP协议比较多,因此RTP和SIP应用相对比较紧密。很多时候,我们花费大量时间讨论SIP协议和传输等问题,没有太多关注RTP流的处理。这里,我们单纯…
-
什么是音画不同步?音画不同步怎么处理
音画不同步是许多开发者经常遇到的一个棘手问题。当音频和视频数据不完全同步时,使视频播放显得非常不自然,观众会有很差的观看体验。因此,了解其原因并掌握相应的解决策略显得尤为重要。 什…