技术文章
-
php-ffmpeg相关操作简介
php操作ffmpeg有两个扩展,一个是ffmpeg-php,这个是不依赖ffmpeg,需要编译安装并在 php.ini 中启用。还有一个是php-ffmpeg,使用php-ffm…
-
第 144 次 MPEG 会议要点:了解基于学习的编解码器对质量的影响和增强绿色元数据
第144届MPEG会议亮点 第144届MPEG会议在德国汉诺威召开!本次会议主要成果如下: 本次会议的主要成果如下: 本文将重点介绍 MPEG 系统相关标准和视觉质量评估,最后将介…
-
什么是 SCTE-35?SCTE-35 基础指南
本文介绍您需要了解的有关 SCTE-35 的一切信息,SCTE-35 是一种流行的事件信令标准,可为电视、直播流媒体和点播视频提供动态广告插播、数字节目插入、停播等功能。 什么是 …
-
FreeTalker: 基于扩散模型的可控语音和文本驱动的手势生成 | ICASSP 2024
目前的工作主要基于话语的音频和文本生成共语手势,却忽略了说话者的非语言动作。为了解决这一问题,我们提出了FreeTalker框架,这是目前首个能生成自发(如共语手势)和非自发(如在…
-
火山引擎 live4D 体积视频方案入选 SIGGRAPH Asia 2023,支持互动体验
近期,SIGGRAPH Asia 2023(The 16th ACM SIGGRAPH Conference and Exhibition on Computer Graphics…
-
WebSockets 与 HTTP 实时通信的优缺点
几个月前,我有一个合作平台项目要开发,其中包括在有影响力的人和品牌代表之间建立实时聊天应用。为了实现这一功能,我一直在寻找如何添加这一功能。结果,我发现了 WebSocket 协议…
-
关于Redisson延迟队列的一些思考
本文来自公众号“ Idea的技术分享”。 最近部门在做一套告警治理相关的系统,专门用于对整个业务线杂七杂八的告警进行治理管控。例如Kakfa异常,业务异常,Dubbo超时等等场景,…
-
TCTP:揭秘高性能以太网中的无损技术
在过去的一年里,随着大模型的爆火,高性能无损以太网技术受到了空前的关注。在大模型的训练过程中,由于采用了分布式训练的并行技术,大量的训练数据和模型被分散于多机多卡上进行处理。因此极…
-
谷歌推出InseRF模型,文本直接在3D场景中生成对象
随着大模型技术的飞速发展,基于语言和视觉的3D场景编辑方法取得了十足进步,如Instruct-NeRF2NeRF在修改和场景控制方面展示了强大功能。但在内容生成方面依然面临困难,例…
-
2024 最新的视频会议标准和协议
视频会议依赖于一系列用于视频封装和会话管理的标准和协议。例如,封装标准规定了如何采集视频和音频、将其转换为数字格式、在端点之间传输并解码。 视频会议信令标准控制会话的建立、拆除和管…
-
基于网络5.0技术的网络视频会议系统
摘要:网络视频会议系统是目前网络办公和信息沟通的主要工具,已具备多样化的功能,在业务组织上分为公有云部署、私有云部署、非云化部署等形式。针对大规模部署的需要,网络视频会议构建了分层…
-
如何使用 WebRTC 创建可与上千人连接和互动的直播
您正在为一个直播活动或会议建立一个平台,将有成千上万的参与者参加。这些参与者希望与您的内容进行实时连接,还希望与内容和/或其他参与者进行互动。如果您正在构建这样一个平台,您就会知道…
-
TransHuman: 基于Transformer的广义体渲染人体表示
在本文中,作者主要研究可泛化的神经渲染任务,该任务从不同人物的多视图视频中训练条件神经辐射场 (NeRF)。为了处理动态人体运动,以往的方法主要采用基于SparseConvNet …
-
WebRTC 中基于损耗的带宽估算
测量可用带宽和避免拥塞是 WebRTC 视频管道中最关键、最复杂的部分。带宽估算 (BWE) 的概念很简单:监控数据包延迟,如果延迟增加或出现数据包丢失,则减少发送数据。前一部分被…
-
接入语音翻译SDK,快速实现实时语音识别和文本翻译识别功能
本文介绍如何接入 ZegoRealtimeTranslation SDK(提供语音翻译SDK),实现“边说话边输出文字”等无障碍沟通效果。ZegoRealtimeTranslati…
-
基于网络5.0的重叠网形态算力网络
摘要:数据是算力时代最为重要的战略性基础资源,而数据的获取、传输、处理、存储和应用均离不开算力资源的支撑。随着数字技术、数字经济、数字社会的快速发展,无论是算力资源需求,还是算力资…
-
游戏服务器与聊天服务器的区别
在游戏玩家和游戏开发者考虑多人游戏时,经常会遇到一个共同的问题。我是否应该重新利用现有的游戏服务器来处理聊天?或者,我是否应该隔离我的游戏服务器,在专用服务器中独立运行聊天? 那么…
-
FreeSwitch是什么(FreeSwitch终极指南)
FreeSwitch 是一个开放源码通信平台,已迅速发展成为专有 PBX 系统和电话解决方案的强大替代品。 FreeSwitch 于 2006 年首次推出,提供了一种免费而灵活的方…
-
嵌入基础模型的高斯溅射
简介:准确感知现实世界中的三维物体的几何和语义属性对于增强现实和机器人应用的持续发展至关重要。为此,本方法提出了嵌入基础模型的高斯溅射(Foundation Model Embed…
-
音视频面试题集锦第 15 期 | 编辑 SDK 架构 | 直播回声 | 播放器架构
继续分享来自关键帧的音视频开发圈的音视频面试题集锦。 下面是第 15 期面试题精选: 1、音视频编辑 SDK 一般包含哪些模块?各模块是什么职责? 2、音视频编辑中转码流程 pip…