技术文章
-
利用WebTransport进行现场视频流注入
编者按:通过网络支持的实时音视频通话已成为人们日常生活和办公中必不可少的一部分,对于音视频领域的网络技术要求也越来越高。对此,LiveVideoStack特别邀请到了来自美国Par…
-
WebRTC ICE 交互流程介绍
在 WebRTC P2P 打洞原理 中,我们大致了解了 P2P 的打洞原理。但实际情况比理论要复杂得多。经典的 NAT(NAPT)可分为完全圆锥型、受限圆锥型、端口受限圆锥型和对称…
-
小布助手:业界首个基于对话音频的小样本语音合成技术实践
01 背景 传统基于神经网络的语音合成方法TTS已成为主流,技术相对也比较成熟,但是需要大量发音人的原始录音数据,制作成本相对较高。因此,少量语音样本的自定义TTS技术是语音合成领…
-
语音识别系列之CTC延迟削减
连接主义时间分类(Connectionist Temporal Classification, CTC)是自动语音识别(ASR)领域的一项经典技术,它的算法简单而优美,漂亮地解决了…
-
Android 屏幕共享SDK如何集成
本文分享在Android端集成即构屏幕共享SDK教程。即构屏幕共享SDK可实现以下共享场景: 集成屏幕共享SDK步骤 准备环境 在开始集成 ZEGO Express SDK 前,请…
-
WebRTC Android 断点调试
本文所有源码均基于 WebRTC M85 (branch-heads/4183) 版本进行分析。 编译 Debug 包 打断点自然需要使用到包含调试信息的 .so 文件。首先要避免…
-
视频质量评价基础与实践
编者按:视频质量评价作为近些年学6领域比较热门的基础研究,已经逐渐在各种业务场景上落地。本次公开课我们邀请到了SSIMWAVE联合创始人与首席研究员,曾凯老师,为大家详细介绍视频质…
-
Opengl ES之RGB转NV21
前言 在上一篇理论文章中我们介绍了YUV到RGB之间转换的几种公式与一些优化算法,今天我们再来介绍一下RGB到YUV的转换,顺便使用Opengl ES做个实践,将一张RGB的图片通…
-
腾讯人脸高效率 3D 数字化技术研究
导读:本次分享主要介绍腾讯 AI Lab 近期在人脸高效率 3D 数字化技术方面的研究成果,包括使用单张照片、多张照片、RGBD 自拍等方式进行人脸 3D 数字化,以及在人脸 3D…
-
跨年联播现场直播方案:一场展现技术和综合实力的盛宴
“陪着你慢慢变好——迎春到”大型跨年联播活动的技术方案全面升级,从计划、筹备到验证、执行,从现场准备到彩排、演练再到最后直播播出,技术服务支撑保障团队在实践中成长。 此次全面升级的…
-
腾讯O264RT,适配最广的端上自研软件编码器
导语 H.264/AVC标准在当前视频应用场景中仍然是应用最广、兼容性最高的视频编码标准,因此任何视频产品如果希望在支持最大范围用户流畅使用的同时保障视频质量,H.264/AVC软…
-
WebRTC编译到Android(WebRTC源码编译)
在正式开始之前,我们需要一个可以运行的 WebRTC 环境。由于笔者是 Android 开发,因此本文将根据 官方文档 将 WebRTC 编译到 Android。 搭建环境 编译到…
-
2023 年 WebRTC API 格局
2023 年已经到来,充满了激动人心的挑战,大量的开发,修复的错误,但总是像往常一样有很多东西要学习。 但在再次深入研究 WebRTC API 之前,我想首先说声“谢谢”。越来越多…
-
Unity集成ZEGO实时语音SDK实现多人状态实时同步
多人状态实时同步功能简介 多人状态实时同步功能提供有序、高频、低延时、大规模的状态同步服务,帮助开发者快速实现虚拟玩法中玩家的位置、动作、形象等实时信息同步能力,同时单场景中支持 …
-
刘铭,左旺孟,张磊等 | 基于预训练GAN模型的图像编辑与复原:训练、探索与理解
研究意义 近年来,生成式对抗网络(GAN)已可实现高分辨率(如1024×1024)图像的高质量生成。在其优秀的生成能力背后,预训练GAN模型包含的自然图像先验及其对图像属性解耦的能…
-
抖音世界杯直播的低延迟是怎么做到的?
世界杯已经结束了,梅西带领阿根廷时隔三十六年之后终于如愿捧杯。抖音直播提供的 4K 超高清超低延迟看播能力给亿万观众留下了深刻的印象,决赛的 PCU 达到 3700w+,在这样大规…
-
什么是I帧P帧B帧?各自的特点有哪些
什么是I帧、P帧、B帧? I帧:intra picture,帧内编码帧 I帧通常是每个GOP的第一个帧,可以看作一个图像经过压缩后的产物,实际就可理解为H.265/HEVC标准下视…
-
WebSocket 前世今生 ?建立 WebSocket 的 6 种方式?
WebSocket 允许创建“实时”应用程序,这些应用程序比传统的 API 协议更快、开销也更小。 WebSocket有时被称为高端计算机通信协议,通过 WebSocket 来建立…
-
FFmetrics – 免费的视频质量测量工具
如果您只是在寻找一种使用FFmpeg计算 VMAF 分数的简单方法,您绝对应该考虑免费和开源的 FFMetrics。在本文中,我将详细介绍从何处获取 FFMetrics、如何安装它…
-
借助Video Intelligence API实现视频智能检测识别
编者按:MeshCloud通过与GCP合作为中国出海企业提供强大的全球基础架构。LiveVideoStack邀请到了MeshCloud的陈满老师,为我们介绍如何借助谷歌云在视频智能…