技术文章
-
音视频ADC在动态范围上的应用
ADC作为模拟与数字信号转换的渠道,是当下数字信号的主要来源之一。随着短视频平台、AR/VR的兴起,产出音视频图像内容已经与我们息息相关了,对音视频ADC的各项指标提出了新的要求,…
-
VLAN的基本配置
1. 原理概述 交换机的VLAN端口可以分为Access、Trunk和Hybrid3种类型。 Access端口是交换机上用来直接连接用户终端的端口,它只允许属于该端口的缺省VLAN…
-
视频压缩客观度量 BD-Rate 和 BD-PSNR的计算和解释
BD-Rate 和 BD-PSNR 是视频压缩中使用的客观度量,用于比较两种不同视频编解码器或同一视频编解码器在一定范围内的比特率或质量值的不同设置的率失真性能或压缩效率。本文着眼…
-
NeuMan:从单视角视频中创建数字人
本文提出了一个新颖的框架,可以从单一野外视频中重构人物和场景,并能够渲染出新的人体姿态和视角。给定一段由移动相机捕捉的视频,作者训练了两个 NeRF 模型:一个是人类的 NeRF …
-
从阵元域到模态域的三维音频技术
随着视频空间化的进程,人们对音频空间化也越来越感兴趣。空间音频也称三维音频,是一项可以在扬声器阵列或者耳机上产生三维方位感的音频技术,其目的是营造一种身临其境的体验,在这种体验中,…
-
什么是EVC(MPEG-5 Part-1)?EVC的标准、架构及编码工具
MPEG-5 Part-1 或 EVC 或基本视频编码是三星、华为、高通和 Divideon 支持的 MPEG 标准。它由两个配置文件组成 – 一个仅使用过期专利且免版…
-
清华朱军团队开源首个基于Transformer的多模态扩散大模型,文图互生、改写全拿下
该论文提出了一个为多模态设计的概率建模框架 UniDiffuser,除了单向的文生图,还能实现图生文、图文联合生成、无条件图文生成、图文改写等多种功能。 据悉 GPT-4 将于本周…
-
ICASSP2023 通用会议理解及生成挑战(MUG)成功举办及获奖团队结果分析
近日,ICASSP2023 通用会议理解及生成挑战(MUG)完成了测试集评测及结果公布,并举办了线上完赛沙龙。本次挑战由ModelScope魔搭社区、阿里巴巴达摩院语音实验室、阿里…
-
视频编码中的Closed GOP 和 Open GOP
在本文中,我们将了解Closed GOP 和 Open GOP 的概念。这两种 GOP 类型在视频流中都很常见,并且会影响您的压缩效率、流的错误恢复能力以及 ABR 流中的可切换性…
-
使用 Handbrake 的视频压缩:安装和使用指南
Handbrake 是一种开源视频转码器,被广泛认为是视频转换的最佳工具。它使用起来毫不费力,支持多平台,并且涵盖范围广泛的预设和设备。这意味着您会发现比以往任何时候都更容易快速压…
-
视频压缩中的离散余弦变换
离散余弦变换 (DCT)可以说是现代图像和视频压缩中最基本的工具。DCT 用于将像素域中的数据转换为频域,以揭示有关图像或视频帧的洞察力。 本文的目的是让您直观地了解 DCT,而无…
-
如何选择正确的高带宽内存(HBM)
尽管多年来一直在努力用更快、更便宜或更通用的存储器来取代DRAM,甚至将其嵌入到SoC中,但DRAM仍然是任何这些架构中的基本组件。DRAM制造商并没有一成不变,而是根据性能、功耗…
-
I 帧、P 帧和 B 帧的工作原理及用途
I 帧、P 帧和 B 帧的概念是视频压缩领域的基础。这三种帧类型在特定情况下用于提高编解码器的压缩效率、压缩流的视频质量以及流对传输和存储错误和故障的恢复能力。 在本文中,我们将了…
-
VVC、EVC、LCEVC——MPEG的视频编解码器
VVC、EVC、LCEVC 是 MPEG 在 2020-2021 年发布的三种视频编解码器,分别称为通用视频编码 (H.266)、基本视频编码 (EVC MPEG-5 Part 1…
-
为什么需要视频压缩?视频压缩怎么做
视频压缩是视频制作中最重要的方面之一。YouTube、Facebook 和 Vimeo 等流媒体服务所面临的数据限制通常会阻碍对高质量视觉和声音的需求,以吸引观众的注意力。本文通过…
-
Gstreamer中的视频处理与硬件加速
编者按:Gstreamer作为一个比较流行的开源多媒体框架,其优秀的架构使其具有高度的模块化和良好的扩展性,并具有广泛的应用前景。LiveVideoStackCon2022上海站大…
-
AV1中的IBC技术
HEVC里面的Intra Block Copy (IBC)技术,它是一种基于块的预测技术,与帧间编码的MCP类似,最大的区别是IBC所用的参考像素是来自当前帧的(未滤波)重建部分,…
-
基于时延光子储备池计算的人体动作识别 | 开超,李璞,杨毅等
研究意义 人类动作识别(HAR)在现代工商业中具有广泛的应用,例如视觉监控、自主导航、视频检索、人机交互等等。然而,由于其建模和特征表示从二维空间扩展到三维时空,高效且精确的HAR…
-
工业相机的丢帧现象如何解决?
工业业摄像头的丢帧现象之所以会发生,其实就是资料通道的堵塞,无法技术处理,所以新的图像采集进来时,前一张图像可能会被迫丢弃,或者是新的图像被迫丢弃。 01 丢帧表现 1、工业相机预…
-
CVPR 2023|快手视频质量评估算法被顶会收录
计算机视觉领域顶级会议Computer Vision and Pattern Recognition Conference(CVPR 2023)将于6月18日至22日在加拿大温哥华…