技术文章
-
基于Web浏览器对音视频编解码的探索和实践
1、引言 音视频编解码在服务端以及客户端,已经是比较成熟的技术。但是在Web浏览器上,如何快速的对音视频进行编解码,实现音视频内容制作、自定义视频播放器等功能,且不依赖于服务端,一…
-
SD 和 HD哪个最适合直播
SD(标清)和 HD(高清)是视频分辨率的两种类型。根据每个视频帧中的像素数量,它们在视频质量和带宽消耗方面有所不同。 高清视频每帧像素更多,从而提高了视频内容质量,帧更精细、更锐…
-
基于残差UNet架构的音轨分离技术探析
1、引言 对于一些需要音频分离的场景,比如基于声音对象提取的虚拟全景声研究、K歌伴奏的提取等,一直是较难实现的行业痛点。 音轨分离,即音乐源分离 (MSS) ,是将混合音频分离成若…
-
如何选择正确的RISC-V内核
随着越来越多的公司对基于RISC-V ISA的器件感兴趣,以及越来越多的内核、加速器和基础设施组件以商用或开源形式出现,最终用户正面临能否做出最佳选择的日益严峻挑战。 每个用户都可…
-
Compression for AGI(大语言模型进行无损压缩)
摘要:在本次演讲中,我们讨论了基础模型如何开始验证 70 多年前形成的假设:更好地压缩源数据的统计模型最终会从中学习更多基础和通用功能。我们首先介绍压缩的一些基础知识,然后描述跨越…
-
基于Unity Cinemachine的镜头跟踪实现方式
在虚拟场景中,通常人物往远处移动时,会离镜头越来越远,而如果我们想要镜头跟随人物移动,可以通过Cinemachine中的虚拟相机来实现。下面会简要介绍一下Cinemachine及其…
-
智能横屏切换竖屏技术揭秘
随着移动互联网的发展与5G时代的到来,通过移动端的短视频传递信息的方式越来越普及,短视频的需求也越来越大,特别是能够提升移动端小屏观看体验的竖屏短视频,如果能够将已有的丰富海量的优…
-
视频分辨率有哪几种?流媒体视频分辨率指南(二)
与其前身相比,每一代或新一代视频分辨率都提供了卓越的增强视觉效果。不同视频分辨率的分类取决于它们在屏幕上的显示方式。通常,我们用它们的名字而不是尺寸来称呼它们。 技术类型 分辨率可…
-
IM专题:分层架构IM系统(11)—登录和登出逻辑实现
通过前面 10 篇文章,对 IM 系统的分层架构设计,以及入口层 Entry、路由层 Router、数据访问层 Das 等每一层的核心职责和关键逻辑进行了深度剖析。 今天开始分析 …
-
什么是视频分辨率?流媒体视频分辨率指南(一)
在当前的数字时代,视频内容已成为我们生活中不可或缺的一部分。视频分辨率在我们的观看体验中起着至关重要的作用。视频分辨率对内容的质量有很大影响。这是主播忽略的一个关键因素。屏幕上可见…
-
基于神经网络的空间音频渲染技术探析
1 前言 如何给用户带来更加真实的沉浸体验,是元宇宙音频技术研究的核心使命。空间音频(Spatial Audio)也称三维声,正是肩负着这样的使命应运而生,空间音频不仅能实现三维的…
-
AVS3中的ESAO
增强样点自适应补偿(Enhanced Sample Adaptive Offset)是AVS3中新增的环路滤波技术,和SAO相比其更充分的考虑了纹理和边缘方向特征。ESAO是在整帧…
-
ARC 和 eARC 能做什么?HDMI 音频功能指南
本文解释什么是 eARC(增强型音频回传通道)和 ARC(音频回传通道),它们有什么区别,以及 HDMI 功能适用于什么。 在家庭或客厅影院中,大多数情况下,HDMI 电缆用于将两…
-
音视频面试题目:播放器的设计及解决卡顿,花屏问题等
以下来自txp玩Linux公众号分享的内容。 今天给大家分享最近一个球友面试的音视频题目,同时我们星球上的球友也转行成功到音视频行业,在今年很多企业都缩减的情况下,着实不容易。 面…
-
FreeRTOS 怎么实现任务间通信
FreeRTOS 是一个可裁剪、可剥夺型的多任务内核,十分好用,而且没有任务数限制,在此之前分析过很多了,简单来说,FreeRTOS实时系统能够创建多个独立的任务,并且任务之间互不…
-
在线 KTV 实现过程(内附demo源码)
摘要:教你3步快速实现在线KTV的开发。 在线K歌自2014年兴起以来,已经发展出了无比庞大的用户群体,每两人中就有就有一人体验过在线 K歌,其前景不可小觑。 如此庞大的…
-
HDFS EC在B站的实践
1.背景 随着B站业务的高速发展,业务产生的数据每天以PB级的速度持续增长,之前主要应对方法是分析数据的使用频率,把数据分为热冷俩类数据,对冷数据进行高密存储来降低存储成本,以及对…
-
音视频编解码—JPEG3 Baseline流程介绍
上一篇讲解了jpeg的基本调用逻辑,但是有朋友私信说其中几个概念不太理解,所以本文做一下说明: base line JPEG JPEG 有许多指定版本,JPEG base line…
-
用多个声学全息图打印3D物体
在本文中,我们将探讨这种采用多个声学全息图的创新方法的工作原理,并研究其潜在的应用和局限性。 声学全息图是可以将声波塑造成复杂图案的设备。它们由具有特定图案的孔或凸起的3D打印板制…
-
DVB-I:试点如何为商业发射铺平道路
DVB-I 是一种通过一组流媒体协议发现服务的方式,使公司能够愉快地进行流媒体内容。它只受入户管道大小的限制,将广播的一对多与一对一统一起来。George Jarrett 报道了意…