技术文章

实时音视频

【音视频】构建视频播放器

这个系列文章我们来介绍音视频相关面试题，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，本篇介绍构建视频播放器。 ——来自公众号“关键帧Keyframe”的分享学习…

RTC观主
2025年10月22日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第五章工具使用

本文是对《智能体设计模式》第五章的翻译。此章节介绍了智能体工具（Tools）和结合工具的智能体设计模式。

AIGC
2025年10月22日
技术文章

火山引擎多媒体实验室联合南开大学推出TempSamp-R1强化学习新框架，视频时序理解大模型SOTA！

在人工智能与多媒体技术深度融合的当下，视频时序定位（Video Temporal Grounding）成为视频理解领域的核心任务之一，其目标是根据自然语言查询，在长段视频流中精准…

大厂Animal
2025年10月21日
技术文章

揭秘 MPEG-I：下一代 VR 和 AR 音频

MPEG-I 沉浸式音频标准由 MPEG 音频工作组（ISO/IEC JTC1/SC29/WG6）近期最终确定，是MPEG-I 沉浸式媒体套件的最新成员。该标准可在虚拟现实（VR）…

音频技术
2025年10月21日
即时通讯

ZEGO即时通讯SDK 2.23.0 版本发布，新增群主退群后的群组 Tips 消息等功能

2025 年10 月 20，ZEGO即时通讯SDK（ZIM）2.23.0 版本发布，新增支持设置用户在客户端发送的消息不计入未读消息数、新增群主退群后的群组 Tips 消息等功能。…

ZEGO即构科技
2025年10月21日
实时音视频

全球沟通零“时差”，腾讯云TRTC 实时翻译AI引擎，全链路助推企业突破“无感”瓶颈

在数字化浪潮和全球化进程的双重驱动下，线上线下的沟通触点倍速增长，跨语言沟通场景在我们的生活、工作中愈发普遍。但常见的翻译工具仍以“说一句、停一下”的回合制翻译为主，机械化、响应慢…

厂商动态
2025年10月21日
实时音视频

libavcodec：音视频编码与解码

本文深入探讨了 FFmpeg 中 libavcodec 库的核心功能——音视频编码与解码。我们将从基础概念出发，逐步解析其工作原理、关键数据结构、API 使用流程，并通过实际代码示…

RTC观主
2025年10月21日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第四章反思

本文是对《智能体设计模式》一书第四章节的翻译，此章节主要介绍了反思（Reflection）模式。

AIGC
2025年10月21日
技术文章

FlexiCodec：3-12.5Hz超低帧率动态音频编解码器

FlexiCodec是一个支持推理时动态调整平均帧率至3Hz到12.5Hz之间的Codec。

编解码
2025年10月20日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第三章并行化

本文是对《智能体设计模式》一书第三章节的翻译，此章节主要介绍了并行化（Parallelization）模式。

AIGC
2025年10月20日
技术文章

优化 OTT 体验：提供更佳 QoE 的五种流媒体策略

据 Mordor Intelligence 预测，全球 OTT 视频市场规模到2025年将达到 3471.1 亿美元，观众注意力争夺战正空前激烈。在这个饱和的市场环境中，仅提供更多…

视频技术
2025年10月20日
实时音视频

libavfilter 音视频处理

本文全面介绍 FFmpeg 中 libavfilter 库的使用方法与核心原理。libavfilter 提供了一套强大的音视频滤镜框架，支持从简单的裁剪、缩放到复杂的音频混合、视频…

RTC观主
2025年10月20日
即时通讯

微信小程序如何实现呼叫邀请功能

即构微信小程序即时通讯SDK（ZIM SDK）提供了呼叫邀请功能，支持主叫向被叫（可为离线状态）发送呼叫邀请、被叫（可为离线状态）接受或拒绝邀请等完整的业务流程控制能力。呼叫邀请…

ZEGO即构科技
2025年10月17日
技术文章

B站多模态精细画质分析模型在 ICCV2025 大赛获得佳绩

暑期，B站多媒体实验室带队参与了 ICCV MIPI (Mobile Intelligent Photography and Imaging) Workshop 的细粒度图像质量定…

大厂Animal
2025年10月17日
实时音视频

【音视频】libavformat 容器格式处理

libavformat 是 FFmpeg 框架中的核心库之一，专门负责处理各种媒体容器格式的解复用（demuxing）和复用（muxing）操作。它为音视频数据的读取和写入提供了统…

RTC观主
2025年10月17日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第二章路由

本文是对《智能体设计模式》一书第二章节的翻译，此章节主要介绍了路由（Routing）模式。

AIGC
2025年10月17日
WebRTC

WebRTC 和 HLS 有什么区别？

流媒体技术在实现实时通信方面发挥着至关重要的作用，了解它们的差异至关重要。如今，有很多视频会议平台利用不同的流媒体传输协议来实现实时通信和高质量的视频流，选择最好的平台可能具有挑战…

webrtc学习和实践
2025年10月16日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第一章提示链

书籍名称：Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems本书作者：Antonio…

AIGC
2025年10月16日
WebRTC

WebRTC 实时通信解析

WebRTC（Web实时通信）是一套开放的实时通信标准，能够在浏览器和移动应用中实现点对点（P2P）的音频、视频和数据传输，无需安装插件或第三方软件。 1、WebRTC概述 Web…

RTC观主
2025年10月15日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 前言

本文是对《智能体设计模式》一书前言部分的翻译，此章节介绍了本书的目录、引言等内容。

AIGC
2025年10月15日