技术文章
-
视频码控 CBR、VBR和ABR的特点及应用场景
问题背景: 无论是查线上一些花屏、卡顿,马赛克问题,还是进行码率自适应的功能开发,抑或进行客户端播放器的JitterBuffer的优化,都需要编码器发送端的配合。我们需要在编码速度…
-
AI时代的视频云转码移动端化——更快、更好,更低,更广
这是我第二次在LiveVideoStackCon分享,第一次时本人肚子还没有这么大,疫情三年肚子长大了,但我们的模型会变得越来越小、越来越快、效果越来越好,这就是“更快、更好、更低…
-
WebRTC 源码分析 (一) Android 相机采集
在 WebRTC Android 中,已经兼容了 Camera 和 Camera2 原生 API 的相机采集,所以我们不必再单独实现一套采集功能。不过我们可以根据 RTC 的抽象…
-
FFmpeg时间戳
FFmpeg内部有多种时间戳,基于不同的时间基准。理解这些时间概念,有助于通过FFmpeg进行音视频开发 在我看来,FFmpeg有两个时间基准:AV_TIME_BASE和AVStr…
-
基于 AI 的媒体编码
MPAI(MOVING PICTURE, AUDIO AND DATA CODING BY ARTIFICIAL INTELLIGENCE)是一个国际化的非盈利性质的组织,主要的研…
-
音视频开发进阶课程|第六讲上:色彩和色彩空间
在前面几篇文章中,我们完成了音频相关基础知识的学习,从今天开始,我们要暂别音频,继续学习视频相关基础内容。 虽说声音在我们日常的生活、工作、娱乐过程中,发挥着不可替代的作用,但人们…
-
Camera 图像 MIPI Raw 是怎么回事?
简介 有时我们得到的Raw图是MIPI格式的,为了能正确读取该数据,我们需要进行MIPI Raw到Raw的转换。本文对将会先介绍MIPI的数据格式,然后用C进行实现。 MIPI R…
-
多路混流实操流程(混流使用说明)
混流是把多路音视频流从云端混合成单流的技术。 混流优点 混流常见使用场景 混流使用说明 SDK 既支持音视频混流,也支持纯音频混流。 开发者在拉流 / 推流成功后开…
-
2022年中国实时音视频行业研究报告
发展背景:网络基础设施升级、音视频传输技术迭代、WebRTC开源等因素,驱动音视频服务时延逐渐降低,使实时音视频(RTC)技术成为炙手可热的研究方向。实时音视频业务在消费互联网领域…
-
OpenGL ES 高级进阶:EGL 及 GL 线程
EGL及GL线程 今天给大家介绍EGL和GL线程,EGL是OpenGL ES开发中很重要的一部分,特别是当想实现一些比较复杂的功能时,就有必要去了解EGL。 另外,了解EGL也对掌…
-
HLS直播协议在B站的实践
01 背景 在音视频直播领域,各种新技术与新标准层出不穷,直播场景也愈发复杂。为了更好的面对未来的挑战,我们需要亟需下一代直播协议来支持这些新标准的落地,B站在此方面进行了…
-
“互动娱乐+声音社交”双擎驱动 荔枝在下一盘什么棋?
随着线上娱乐产业的发展以及音频技术的创新,音频互动娱乐和音频社交逐渐兴起,中国在线音频迎“耳朵经济”蓬勃发展期。北京时间8月19日上午,“中国在线音频第一股”荔枝集团(NASDAQ…
-
SCTE 35, SCTE 250, SCTE 224的介绍
本文介绍了SCTE 中的三个关于视频广告插入的三个标准分别是SCTE 35, SCTE 250 和 SCTE 224。 SCTE 标准介绍 电缆电信工程师协会(SCTE,The S…
-
最后一公里:从直播拉流读懂直播链路
直播是一个庞大而复杂的业务形态,一个优秀的直播系统涉及众多团队的共同协作,有非常完整的直播链路。那么,直播链路中都有哪些角色?这些角色要解决的是哪些问题?要优化某个环节时需要哪些角…
-
游戏开发面试题 — 图形学篇
以下文章来源于游戏君五尘 ,作者五尘君。 图形学和3D数学篇,收录了几十道面试真题,也欢迎小伙伴后续提供以便继续更新。 因第二篇内容主要来源于网上,未原创发表在公众号,文章链接如下…
-
社交元宇宙的进化论
来源:光子星球 作 者:文烨豪 走出《雪崩》的一年后,元宇宙并未如批评家们预期那般遭遇“雪崩”,相反,越来越多的玩家绞尽脑汁,试图把业务同这一火热的概念搭上联系。 翻看现阶段各类玩…
-
色彩空间与图像/视频编码
视频工作者倾向于把色彩空间当作视频的内在属性,而图像工作者更多地把它们当作编码工具。Vimeo 的首席视频工程师 Derek Buitenhuis 将介绍色彩空间与图像/视频编码的…
-
游戏中背景音乐和音效的视听同步研究
本文主要介绍了游戏中背景音乐和音效的视听同步研究,通过实验探索研究了人们对视听同步的感知能力和个体差异,以及影响视听同步的主要因素。 谈及游戏中的视听研究,很容易想到的就是在游戏过…
-
从阿里云全球实时传输网络GRTN出发,浅谈QOE优化实践
直播已深入每家每户,以淘宝的直播为例,在粉丝与主播的连麦互动中如何实现无感合屏或切屏?阿里云GRTN核心网技术负责人肖凯,在LVS2022上海站为我们分享了GRTN核心网的运作机制…
-
Camera Sensor 信号输出 YUV、RGB、RAW DATA、JPEG 4种方式区别
简单来说: YUV: luma (Y) + chroma (UV) 格式, 一般情况下sensor支持YUV422格式,即数据格式是按Y-U-Y-V次序输出的 RGB: 传统的红绿…