技术文章
-
学习 WebRTC 的正确姿势?“碰碰运气”的方法不适用于 WebRTC 应用
WebRTC 如今可能无处不在,但使用它进行构建仍然很难。许多人试图依赖 Stack Overflow 中的代码片段,而不了解 WebRTC 的基本理论和流程。这可能是一种冒险的尝…
-
基于 QUIC 的 HTTP 自适应流媒体的可扩展高效视频编码 | EPIQ 2020
HTTP/2已经被广泛研究用于自适应视频流传输,但仍然存在由于TCP引起的先行阻塞和三次握手延迟的问题。与此同时,运行在UDP之上的QUIC可以解决这些问题。此外,尽管已经提出了许…
-
分布式UUID的生成策略及应用场景浅析
UUID是国际标准化组织(ISO)提出的一个概念。UUID用来识别属性类型,在所有空间和时间上被视为唯一的标识。本文将从UUID的构成方式、现行版本、生成策略、应用案例等方面作介绍…
-
FFmpeg 中 Libavutil 和 libavcodec库的方法和功能
ffmpeg还提供一系列的库,能提供开发者进行编码开发。其中 libavutil 是一个包含用于简化变成的函数的库,包括随机数生成器、数据结构、数学例程、核心多媒体实用程序等等。l…
-
基于真实环境的元宇宙场景搭建关键技术发展态势研究
摘要:基于真实物理环境构建的元宇宙场景是连接物理世界与数字世界的重要桥梁,也是实现数字孪生到虚实共生的重要途径。围绕三维重建、渲染等元宇宙场景搭建关键环节,总结了当前主流技术路径与…
-
WebRTC联播:谁决定在接收端选择哪一层?
在 WebRTC 中,接收端选择哪一层的决定通常由 WebRTC 实现和底层媒体堆栈来处理。适当层的选择取决于各种因素,例如网络条件、可用带宽和接收器的能力。 层的选择通常使用反馈…
-
利用WebRTC实现无缝实时通信
朋友们好,今天我们来谈谈WebRTC。首先,我将简要解释一下什么是WebRTC,然后我们将看看WebRTC的应用领域,以及我们为什么要选择WebRTC。 什么是WebRTC? We…
-
视频编解码器与视频容器的区别和用例
视频编解码器和视频容器在多媒体和流媒体中发挥着至关重要的作用。了解这些术语的区别有助于您在处理和分发视频内容时做出明智的决策。 本文将深入介绍视频编解码器和容器的基础知识,探讨它们…
-
深度学习在语音增强中的应用
随着科学技术的发展,语音作为新一代人机交互方式,成为人和智能设备、语音助手交流的重要接口,然而在真实环境中,语音信号不可避免的被各种噪声所干扰,除了各种环境噪声,声波在封闭空间中的…
-
在OpenCV中进行图像预处理
今天,我们进一步深入,并处理在图像处理中常用的形态学操作。形态学操作用于提取区域、边缘、形状等。 什么是形态学操作? 形态学操作是在二值图像上进行的。二值图像可能包含许多不完美之处…
-
相机APP 如何选择合适的分辨率?
影响相机画面效果的因素有很多,分辨率就是其中一个因素,1080p和720p的效果对比,画面清晰度等差别还是挺大的。 这篇文章主要分下面几点展开: 做camera效果tuning调试…
-
OpenGL ES 3.0 怎样将着色器程序二进制化
之前有位 VIP 读者提问:C++ 如何将 OpenGL ES 的着色器程序二进制(保存),然后在其他地方加载使用?现在写篇文章介绍下。 将着色器程序二进制化(Shader Pro…
-
音视频工具–Onvif设备管理器
ONVIF 设备管理器 (ODM) 是一款免费的开源软件实用程序,旨在管理符合 ONVIF 标准的网络视频设备,例如 IP 摄像机、视频编码器和网络录像机 (NVR)。ONVIF …
-
WebRTC NetEQ分析:架构和核心模块
1.NetEQ简介 NetEQ 本质上就是一个音频的 JitterBuffer(抖动缓冲器),全称是 Network Equalizer(网络均衡器), GIPS 语音引擎的两大核…
-
多模态算法在AIGC视频生成中的应用
随着抖音、快手、B站等视频平台的崛起,视频内容正占据着用户越来越多的时间。对于各个平台来说,内容视频化趋势明显。对于之家来说,也需要尽快完成在该赛道的技术工作。对于AIGC视频生成…
-
音视频领域强大的辅助工具-ffmpeg常用操作介绍
前段时间老是有人问我,有没有其他格式的视频或音频提供,愿意有偿获取,如果其对ffmpeg比较熟悉,就不会那么麻烦。经常从事流媒体领域开发和研究工作的人,ffmpeg应该是我们最常用…
-
基于有意义学习的零样本语义分割方法 | 北航刘祥龙团队
研究意义 图像语义分割是计算机视觉中最重要的分支之一,被广泛应用于许多现实世界的场景中,如地理信息系统、自动驾驶、医学图像分析等。然而,传统的语义分割方法极大地依赖于像素级标注信息…
-
音视频通信及信令SIP协议压测方法浅析
网络基础设施升级、音视频传输技术迭代、WebRTC开源等因素,驱动音视频服务时延逐渐降低,使实时音视频(RTC)技术成为炙手可热的研究方向。实时音视频业务在消费互联网领域蓬勃发展,…
-
图像压缩对视觉识别的鲁棒性分析
目前,能够分析视觉数据而不仅仅是存储数据的最先进的识别模型无一例外地基于深度学习。尽管在降低推理成本方面做出了巨大的努力,但它们对内存和计算的要求很高。而图像压缩对于促进在设备上存…
-
增强x265开源HEVC视频编码器: 降低比特率和场景变化检测的新技术
由于对带宽的要求越来越高,特别是随着更高的设备分辨率的出现,对降低视频传输比特率而不影响视觉质量的需求也在增加。HEVC视频编码标准适合解决这一问题,它能以比其前身(H.264/A…