技术文章
-
B站WebRTC测试实践
背景 RTC(Real time communication)实时通信,是实时音视频的一个简称,我们常说的RTC技术一般指的是WebRTC技术。 WebRTC是一个由Google发…
-
LivelySpeaker: 面向语义感知的共话手势生成 | ICCV 2023
手势是人们讲话时伴随的重要行为,尽管以前的方法和技术能够生成与讲话节奏同步的手势,但这些手势通常缺乏讲话的语义背景。尽管在人类讲话中语义手势并不是非常普遍,但它们对于观众更深入理解…
-
什么是 P2P 和 A2P 消息传递?
如果您希望开始使用 SMS 作为客户沟通的渠道,则需要了解A2P和P2P消息传递。您以前可能听说过这些术语,但了解其中的差异将有助于您为您的业务选择最佳选择。 什么是 A2P 消息…
-
OpenGL ES 如何直接渲染 P010、P016 格式图像?
前面文章已经介绍过如何渲染 16bit 灰度图,本篇基于同样的思路来实现 P010、P016 格式图像的渲染。 P010 最早是微软定义的格式,表示的是 YUV 4:2:0 的采样…
-
查看视频码流编码器配置的方法
经常用mediainfo可能会发现,mediainfo能够展示出x264/x265的编码参数,例如: 这一功能是怎么实现的呢?或者说,mediainfo从哪里获取到的编码参数? x…
-
2024 年 WebRTC 应用必备的人工智能
在这个季节,我们要总结过去的一年,展望未来的一年。在商业世界里,我们必须将狂热的时尚与值得在 2024 年投入较少预算的基本产品区分开来。从时尚到食品,当然还有科技行业都是如此。 …
-
抖音为何要不断提升画质体验?
导读 本文从抖音集团内部画质优化方案的孵化历程着笔,主要分享了画质优化对于业务的价值、主要应用场景和内部产品的一些典型实践案例。通过分享业务视角遇到的一些问题和我们的解决思路,希望…
-
C3: 图像与视频通用的高性能低复杂度神经压缩器
内容摘要:C3 方法基于 COOL-CHIC,并对图像进行了几项简单而有效的改进。作者进一步开发了将 C3 应用于视频的新方法。在 CLIC2020 图像基准上,我们的 RD 性能…
-
音视频面试题集锦(第 13 期)
我们在知识星球上创建的音视频技术社群关键帧的音视频开发圈已经运营了一段时间了,在这里大家可以一起交流和分享音视频技术知识和实战方案。我们会不定期整理一些音视频相关的面试题,汇集一份…
-
ASRU2023 | BA-MoE: 基于边界感知混合专家的中英混杂语音识别
语种混杂(Code-mix)是一句话中交替使用两种或多种语言的行为,在当今全球化和文化多样的世界中变得越来越普遍。这种语言现象对语音和语言处理任务,特别是语音识别(ASR)形成了新…
-
浅谈WebSocket协议-RFC 6455
Labs 导读:在WebSocket出现之前,一个Web应用(即时聊天、多人协作)的客户端和服务端之间常见的双向数据交换方式有短轮询、长轮询、SSE(Server-Sent Eve…
-
H.266 编解码器:什么是多功能视频编码(VVC)?
视频文件很大,如果没有编解码器,在互联网上传输这些文件将非常困难。编解码器在不断发展,以优化这一技术工作流程,而多功能视频编码即将推出新的改进型编解码器。 在本篇文章中,我们将讨论…
-
什么是VPaaS(视频平台即服务)?
什么是 VPaaS(视频平台即服务)? 视频平台即服务(VPaaS)技术是一种基于云的平台,可帮助企业创建完整的视频流和会议体验。该技术可帮助企业轻松地为其网站和应用程序添加特色和…
-
座舱音频系统的架构设计和音频体验
编者按:近年来,智能座舱体验日益成为汽车竞争力的核心,智能座舱的多样体验正在成为用户购车时考虑的重要因素。 LiveVideoStack2023深圳站邀请到蔚来汽车座舱音频系统软件…
-
SCTP:让“可靠”变得“更快更安全”的数据传输协议
Part1:什么是SCTP? SCTP(Stream Control Transmission Protocol,流控传输协议)的出现,并不是万丈高楼平地起,而是站在TCP这个巨人…
-
ICASSP 2024|快手获得语音信号质量增强挑战赛和语音音频丢包隐藏挑战赛双料世界冠军
近日,国际声学、语音与信号处理顶会(IEEE International Conference on Acoustics, Speech and Signal Processing…
-
音视频开发者必知的 ISO/IEC/ITU 音视频体系标准
01 常见的国际标准化组织 音视频开发者需要了解ISO/IEC/ITU发布的常见音视频标准,这对他们的编程开发工作至关重要。这些标准包括但不限于:MPEG-1、MPEG-2、MPE…
-
Web 端 1v1 视频聊天示例源码
1v1 视频聊天在泛娱乐场景的应用越来越广泛,为满足广大开发者的试用要求,即构也发布了Web端的 1v1 视频聊天 Demo 源码,命名为Chat1v1。 Chat1v1 是基于 …
-
818台网直播技术解析与优化策略
1. 引言 在万物互联的新时代,数字经济势不可挡,“数字化转型”成为热词,其中直播作为数字化经济发展的重要一环,已然成为当下最热门的互联网场景应用之一,同时也是企业传播信息、展示产…
-
HTTP 流媒体的演变:从渐进下载等到 HLS 和 DASH
2022 年第三季度,通过流媒体直播消费的内容达到了 72 亿小时,这一数据突显了流媒体的巨大受欢迎程度,也强调了 HTTP 流媒体技术在塑造我们的观看体验方面所起的关键作用。 在…