技术文章
-
YUV 图像工具:Libyuv 的编译与使用
前言 在 Android 系统上, Camera 输出的图像一般为 NV21(YUV420SP 系列) 格式, 当我们想进行录像处理时, 会面临两个问题 问题 1 图像的旋转问题 …
-
变速不变调之sonic源码分析(音视频开发之旅67)
目录 基音周期、浊音的概念 Sonic源码分析 资料 收获 上一篇我们学习了音频变速不变调的原理以及WSOLA波形相似叠加算法进行时域压扩处理。其中在寻找相似帧方面,Sonic采用…
-
音视频开发进阶课程|第五讲:音频编解码的必要性解读与格式选取
在上一篇文章中,我们完成了对音频前处理三剑客的学习。声音信号经过音频前处理模块,已经“洗尽铅华、去除杂质”,现在,你是否已迫不及待想要将它们分享到世界各地了呢?但稍安勿躁,想要更好…
-
通过智能视频分析和增强来促进视频转码
对于短视频应用,上传到云端的视频已经被严重压缩,对于一般质量的视频需要进一步增强后转码。提出的 CAE 方案通过对视频内容分类,针对性的预处理增强,以及自适应编码,相比原始的 x2…
-
图像识别的预处理技术
图像识别中,图像质量的好坏直接影响识别算法的设计与效果精度,那么除了能在算法上的优化外,预处理技术在整个项目中占有很重要的因素,然而人们往往忽略这一点。 图像预处理,将每一个文字图…
-
识别用户消费环境的 ABR 流媒体,改善 QoE 和资源使用权衡
本文介绍了确定用户消费视频时的使用环境的重要性,并介绍了一种识别用户使用环境并运用在 ABR 流媒体中的实践策略,以实现在用户体验和资源使用方面带来更好的权衡。 目前智能手机在播放…
-
MediaCodec 在 Android 硬解码的路线
随着多媒体产业的发展,手机端对视频解码性能要求越来越高。如果采用cpu进行解码,则会占用很多cpu资源。现在主流做法是利用手机gpu资源进行视频解码。 Android系统在Andr…
-
Android 图形架构
要理解Android的图形架构,我们需要先理解window的概念。维基百科中给window的定义是:Window是图形用户界面(GUI)系统中显示器上一个单独的视图区域(可以想象你…
-
Swipe Alone: 短视频服务的测量研究
这篇文章主要介绍了对短视频服务的相关研究,通过调研 4 种流行的短视频服务研究他们的编码变体、感知视频质量、预加载策略及数据消耗与视频质量之间的相关性。 短视频是社交媒体中被广泛应…
-
音频变速不变调的原理
音频的原始pcm数据是由 采样率、采样通道数以及位宽而定。常见的音频采样率是44100HZ,即一秒内采样44100次,采样通道数 一般为2, 代表双声道,而位宽一般是16bit 即…
-
WebXR 技术调研 – 在浏览器中构建扩展现实(XR)应用
WebXR 是一组支持将渲染 3D 场景用来呈现虚拟世界(虚拟现实,也称作VR)或将图形图像添加到现实世界(增强现实,也称作AR)的标准。通过该 API 可以访问 VR/AR 虚拟…
-
游戏中背景音乐和音效的视听同步研究
本文主要介绍了游戏中背景音乐和音效的视听同步研究,通过实验探索研究了人们对视听同步的感知能力和个体差异,以及影响视听同步的主要因素。 谈及游戏中的视听研究,很容易想到的就是在游戏过…
-
云/移动端媒体处理技术分享
今天在部门内做了一个分享,我整理了一下也分享给大家。文章的内容是我在上家单位做的云剪辑和短视频处理用到的一些技术和架构。 先来说一下当初做这个跨平台媒体处理的一个指标吧,当初是对标…
-
数字图像处理基本知识
1、数字图像: 数字图像,又称为数码图像或数位图像,是二维图像用有限数字数值像素的表示。数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的…
-
RL-AFEC:基于强化学习的实时视频通信自适应前向纠错
本文主要介绍了一种新的用于实时视频通信的自适应前向纠错(AFEC)。能够改善由于视频包丢失导致的视频质量,同时最小化额外带宽。工作主要包括两部分:PL-VQA —— 一种新的无参考…
-
SpringBoot实现人脸识别功能
前言 去年在公司参与了一个某某机场建设智能机场的一个项目,人脸登机是其中的一个功能模块,当时只是写了后台的接口,调用人脸识别设备的api,给闸机回传数据信号,以保障该功能的正常使用…
-
艾瑞咨询发布2022年中国视频云服务行业研究报告
视频原生时代来临,视频应用正加速向各行各业渗透。视频云基础设施属性显现,将有望为全行业输出商业创新与变革的源动力。 2021年中国视频云服务整体市场规模达到448亿元,预计未来三年…
-
人脸视频的生成式压缩:混合编码方案
VVC作为最新的视频编码标准,在保持像素质量方面表现出了良好的性能。为了挖掘视频会议场景在超低码率下的更大压缩潜力,我们提出了一种码率可调的人脸视频混合编码方案。该混合方案结合了传…
-
RTC 性能自动化工具在内存优化场景下的实践
背景介绍 性能测试是 SDK 发版的重要依据,VolcRTC 的业务方对于性能指标都比较重视,对于 RTC 准入有明确的准入标准。因此我们建立了线下的性能自动化测试系统,测试过程中…
-
人像分割技术解析与场景应用
抠图简介 抠图主要解决的是图像中前景和背景区域的准确预测问题,对于图像编辑和影视制作有着极其重要的实际意义。所以准确有效的抠图算法可以极大的改善内容生产的工作流程,从而节省大量的人…