技术文章
-
音视频生产关键指标:视频编辑优化丨音视频工业实战
在视频编辑场景中,涉及到的模块很多,比如:抽帧模块、预览播放模块、视频编辑模块、特效合成模块、视频转码模块等等。这些模块各自都有对应的性能指标,这些指标影响着编辑场景的用户体验。这…
-
IEEE VR 机器学习:360° 图像的扫描路径生成模型
论文名称:ScanGAN360: A Generative Model of Realistic Scanpaths for 360° Images论文作者:Daniel Mart…
-
火山引擎 veImageX FPGA HEIF 静图编码服务性能优化
互联网内容的展示离不开图片,通过 CDN 展示分发图片可以提升图片访问速度,但是也需要为带宽付费。HEIF 图片格式有着卓越的压缩性能,相比 WebP 可以节省 30% 的图片码率…
-
VVC(多功能视频编码)中基于块的变换的解释
多功能视频编码 (VVC/H266) 标准于 2020 年 7 月发布,成为高效视频编解码器 (HEVC/H265) 的继任者。测试表明,VVC 可节省高达 30% 的比特率资源,…
-
图像分割深度学习从零开始学习路线
第零阶段:看分割看不懂 这个阶段典型表现是,对于梯度下降,交叉熵损失,激活函数等概念模棱两可,这可能是博主说的零基础入门。你可能需要对深度学习和计算机视觉的基本任务有一个较为系统的…
-
多路推流怎么用?设置同时推多路流 | 实时音视频SDK功能系列2
推多路流即 SDK 提供了同时推多路流的能力。目前即构实时音视频 SDK 支持最大推流通道数量为 4 路流,2.14.0 之前版本默认最大推流通道数量为 2 路,如需支持更多推流通…
-
如何选择音视频 QoE 或 QoS 供应商
彼得·德鲁克(Peter Drucker)的一句名言是“无法衡量的东西无法改进”,这很适合视频流媒体行业。 视频行业竞争非常激烈,多家内容提供商在争夺一小部分用户。在这种情况下,工…
-
使用 FFmpeg 进行音频转码 – 使用 FFmpeg 轻松更改音频编解码器
在本 FFmpeg 教程中,我们将了解如何在不更改视频的情况下将媒体文件中的音频编解码器从一个编解码器/容器更改为另一个。如果您想将音频编解码器从 AAC 更改为 MP3 或类似而…
-
微信小程序语音视频通话功能 | 基于微信原生组件实现通话
本文将介绍如何使用微信小程序原生推拉流组件 <live-pusher> 和 <live-player>进行推拉流,通过即构音视频SDK快速实现一个简单的实时…
-
面试中经常被问到的 OpenGL ES 对象,你知道的有哪些?
VBO 和 EBO VBO(Vertex Buffer Object)是指顶点缓冲区对象,而 EBO(Element Buffer Object)是指图元索引缓冲区对象,VBO 和…
-
WebRTC 在游戏中的多种用途
游戏产业对当今娱乐圈的影响是不可否认的。2021 年,这个“超级平台”价值超过 3000 亿美元,全球游戏玩家超过 27 亿。它是一头比电影和音乐产业加起来还要庞大的野兽。&nbs…
-
WebRTC 信令服务器:您需要知道的一切
在WebRTC信令服务器之前,我们先简单解释一下什么是WebRTC。WebRTC 代表网络实时通信。它是一项强大的技术和开源流协议。 WebRTC 与 HTML5 兼容,它允许您向…
-
选择WebRTC API 服务商要考虑的 5 个安全标准
如果您正在选择一个靠谱的 WebRTC 音视频 API 服务商,那么一个核心但经常被忽视的功能一定要引起重视了,这个核心功能就是服务商如何保护您作为客户和您的最终用户数据提供保护和…
-
webrtc直播入门:直播基础知识+WebRTC服务开源技术选型
最原始的直播系统其实并没有想象的那么复杂,无非就是主播端将音视频数据推送到服务器,观众端则从服务器拉取数据播放。 1 直播基础知识 1.1 基本常识 1.1.1 基础概念 推流,是…
-
webrtc android入门:Android端如何使用WebRTC互联互通
在学习 WebRTC 的过程中,学习的一个基本步骤是先通过 JS 学习 WebRTC的整体流程,在熟悉了整体流程之后,再学习其它端如何使用 WebRTC 进行互联互通。 本文将讲解…
-
场景化 AI 降噪解决方案(实时互动RTI能力系列篇2)
噪声降低通讯质量 噪声在我们日常生活中十分常见,例如,鼠标点击声、键盘声、空调声、厨房碗碟碰撞声。所以音频质量往往决定了在音视频通讯场景中的通话体验,而噪声又是决定了音频质量是否良…
-
ACM MM2022|基于多尺度 Transformer 的视频插帧方法
本文介绍我们最新发表在 ACM MM2022 会议的工作,使用多尺度由粗到精 transformer 的视频插帧方法。在该论文中,构建了一个两阶段的多尺度视频插帧结构,分别主要进行…
-
如何实现自定义视频渲染 | 实时音视频SDK功能系列
什么是自定义视频渲染 自定义视频渲染指的是 SDK 向外部提供本地预览及远端拉流的视频帧数据,供用户自行渲染。 当开发者业务中出现以下情况时,推荐使用 即构实时音视频SDK 的自定…
-
WebRTC 屏幕分享深度解析
前言 今天突然发现自己对 WebRTC 的屏幕分享的底层工作原理有一个误解,之前,我一直以为屏幕分享就是简单的采集桌面的画面,然后编码发送就行了。实时上并不是如此简单,本文就来为大…
-
关于 YUV 格式的一些总结
一、YUV和YCbCr 1、定义 YUV,是一种颜色编码方法,常使用在各个视频处理组件中。Y表示明亮度(Luminance或Luma),也就是灰阶值,U和V表示的则是色度(Chro…