技术文章
-
流媒体之GB/T28181协议介绍
说到GB/T28181协议,如果你是从事视频监控领域的工作,那对他一定不陌生,在公共安全、城市治理、政务监管、企事业监管等涉及视频汇聚、视频监控等场景,它已经是视频终端设备、监控平…
-
实现一个h264编码器前期准备
前言: H264是新一代的编码标准,以高压缩高质量和支持多种网络的流媒体传输著称,在编码方面,我理解的他的理论依据是:参照一段时间内图像的统计结果表明,在相邻几幅图像画面中,一般有…
-
YCoCg颜色空间及屏幕内容编码
不知大家是否有接触过YCoCg颜色空间,它其实是对RGB颜色空间的无损转换,其中Cg是色度绿色Chroma green缩写,Co是色度橙色Chroma orange缩写。从压缩的角…
-
FFmpeg编译错误分析方法示例
同事问了一个FFmpeg编译错误问题,几乎100%复现: 1. Windows msys + mingw工具链环境 2. 编译动态库 报错信息: 以这个问题为例,我们看下编译错误如…
-
掌握APP通信:深入了解聊天API 和 SDK
出色的应用程序创意和时尚的设计可能会吸引用户的兴趣,但真正的赢家是什么?一款能让用户流连忘返的APP。 实现这一目标的关键策略是应用内消息。最近的统计数字表明,仅集成应用内消息功能…
-
即构科技发布 Web实时音视频SDK 3.0,提供Web 播放器和本地导播插件等功能
10月20日,即构科技Web实时音视频SDK 3.0重磅升级,具有快速接入、无需安装,支持跨平台运行等优势,为企业及开发者带来更加智能实时互动的音视频体验! Web实时音视频SDK…
-
比心直播的音视频质量建设
比心是面向 Z 世代的电竞社区,有超过 800 万的电竞大神,6000 万的资深玩家,累计与 20 多家顶级战队达成战略合作。最近几年开始快速发展直播业务,目前直播间内容已相当丰富…
-
实时通信利器:一文学会驾驭WebRTC API
WebRTC(Web Real-Time Communication)是一项开放标准和技术集合,由 W3C 和 IETF 等组织共同推动和维护,旨在通过Web浏览器实现实时通信和媒…
-
如何使用 SpringBoot 和 Flutter 创建聊天应用程序
本文将介绍使用 Spring Boot 和 Flutter 创建一个简单的聊天应用程序。这将帮助我们了解如何在 Flutter 和 Spring Boot 中使用 SockJS 配…
-
在 SpringBoot 和 React 中配置 WebSocket
本文将逐步介绍如何在 Spring Boot 中配置 WebSocket 并将其与 React 配合使用。 依赖项 我们只需要两个依赖项,尽量减少所需的依赖项数量。 配置 接下来,…
-
OTN网络时延是什么?一分钟搞清!
OTN网络时延是什么? 看到这个问题,有人可能会说,这个不简单吗?OTN网络=光传送网,传输信息的速度=光速,时延=数据传输所花费的时间,那不就是用下方公式嘛: NONONO!本期…
-
如何实现简单的Web聊天功能(Web聊天功能开发)
实时系统和信息平台已成为我们日常生活中必不可少的工具,可实现即时用户交流。从文本消息和电子邮件到微信 或 WhatsApp 中的群组聊天,我们都有自己喜欢的平台来与朋友和同事保持持…
-
ZGaming:通过图像预测实现零延迟 3D 云游戏 | SIGCOMM 2023
在云游戏中,交互延迟是影响用户体验的最重要因素之一。尽管可以通过边缘缓存和拥塞控制等典型网络基础设施来降低交互延迟,但当前云游戏平台的交互延迟仍然远不能满足用户的要求。本文提出了Z…
-
火山引擎实时、低延时拥塞控制算法的优化实践
摘要 火山引擎智能拥塞控制算法 VICC(Volcano Intelligent Congestion Control)是一种自适应的拥塞控制算法,旨在解决全球不同网络环境下,不同…
-
VoIP和多人在线游戏的演变
深入了解在线多人游戏世界,您会发现它经历了一段相当长的旅程。在高分辨率图形和复杂的游戏机制中,有一位沉默的英雄重塑了游戏体验:VoIP(基于IP的语音传输的一种语音通话技术)或叫网…
-
AVCC/HVCC 与 Annexb 码流格式相互转换丨音视频工业实战
H.264 的码流中用于解码的关键信息包括 SPS、PPS,H.265 码流中则包括 VPS、SPS 和 PPS。H.264 码流有 AVCC 和 AnnexB 两种格式,H.26…
-
Qt音视频通话示例源码体验
本文示例源码为一个桌面端跨平台的 Qt5 C++ 应用程序,同时支持 Windows/macOS/Linux 平台,示例源码中已附带了三个平台最新版本的 SDK 包,可以直接运行。…
-
什么是WebRTC数据通道?如何用WebRTC数据通道加强实时通信
WebRTC 是一项功能强大的技术,可实现网络浏览器和移动应用程序之间的实时通信。它彻底改变了我们的通信方式,使实时共享音频、视频和数据成为可能。WebRTC 最重要的功能之一是数…
-
CoDi: 利用可组合扩散实现任意组合模态的处理与生成 | NeurIPS 2023
本文作者提出了可组合扩散模型(CoDi)。这是一种新的生成模型,能够处理任意组合模态输入,如语言、图像、视频和音频,进而生成任意组合模态输出。不同于先前已有的生成式AI系统,CoD…
-
端到端语音识别中的建模单元
端到端语音识别中不同的建模单元有着不同的应用场景,本文对中英文常用的一些建模方式以及如何生成对应的标签进行总结,希望对大家有所帮助。 I. 中文建模单元 音素(phoneme) 音…