技术文章

技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第十章模型上下文协议

本文是对《智能体设计模式》第十章的翻译。此章节介绍了模型上下文协议（MCP协议）。

AIGC
2025年10月29日
技术文章

触手可及：触觉技术成为虚拟现场体验的核心

整个视频行业，尤其是体育行业，正在走向多模态化。随着行业将分辨率、动态范围和音频保真度提升至难以进一步变现的高度，单纯的画面和音频已无法满足需求。因此，业界正将目光投向能增强赛…

虚拟现实
2025年10月29日
实时音视频

如何构建视频面试平台？

您是否了解一款能让招聘变得智能高效、不受地域限制的视频面试平台？该系统能更便捷快速地开展常规面试，助您发掘最优秀的候选人。若您想了解如何构建视频面试平台，本文将介绍其核心功能、使用…

ZEGO即构科技
2025年10月28日
即时通讯

常用 Web 实时通信技术：原理+选型，一篇通关

在 Web 开发中，实时通信技术的核心目标是实现客户端（Browser）与服务器之间低延迟、双向 / 单向的动态数据交互，而非传统 HTTP 的 “请求 – 响应” 模…

大厂Animal
2025年10月28日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第九章学习与适应

本文是对《智能体设计模式》第九章的翻译。此章节介绍了支撑智能体学习与适应的原理和机制。

AIGC
2025年10月28日
技术文章

非极客实时 AI 视频增强指南

本文分享 Pixop 的技术专家 Jon Frydensbjerg 眼中的 AI 视频增强。全文如下。致真正的非技术人士：本文同样面向非技术读者，据说并非所有人都知道“精灵（Sp…

视频技术
2025年10月27日
技术文章

观点：IPMX 是否正在取代 ST 2110？

IPMX（IP Media Experience）会取代 SMTE ST 2110 吗？不会，至少目前来说，它们针对的是不同的应用领域。IPMX是“简化版ST 2110（且可能更…

视频技术
2025年10月27日
实时音视频

音视频面试题集锦第 42 期｜ Android 音视频方向面试题实录

本文来自音视频技术社群关键帧的音视频开发圈的分享，该社群会定期整理一些音视频相关的面试题，本期分享 Android 音视频方向面试题实录。下面是我们技术社群的一位群友最近面试 J…

RTC观主
2025年10月27日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第八章内存管理

本文是对《智能体设计模式》第八章的翻译。此章节介绍了智能体系统的内存管理机制。

AIGC
2025年10月27日
技术文章

Liquid AI 发布 LFM2-VL-3B，为边缘设备带来 3B 参数的视觉语言模型

Liquid AI 发布了 LFM2-VL-3B，这是一个用于图像文本到文本任务的 3B 参数视觉语言模型。它扩展了 LFM2-VL 系列，使其超越了 450M 和 1.6B 版本…

AIGC
2025年10月27日
实时音视频

基于 SRT 协议的安全推流整合方案在云手机产品中的应用

为落实国家“十四五”数字经济与新型基础设施建设规划，遵循数据安全法和个人信息保护法的相关要求，推动云手机安全传输技术国产化与标准化，针对云手机音视频流传输的高丢包、低安全与延迟等问…

mazhu
2025年10月24日
实时音视频

【音视频】媒体播放器缓冲策略

这个系列文章我们来介绍音视频相关面试题，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，本篇介绍媒体播放器缓冲策略。 ——来自公众号“关键帧Keyframe”的分享 …

RTC观主
2025年10月24日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第七章多智能体协作

本文是对《智能体设计模式》第七章的翻译。此章节介绍了多智能体协作和通信的内容，以及如何进行相关设计。

AIGC
2025年10月24日
实时音视频

视频编码标准中的随机访问(random access)

每当你在视频流中跳转到想要的场景、在稍后时间继续观看电影、切换电视频道，或是加入已经开始的视频会议时，你都在使用一种名为随机访问（random access）的视频解码功能。

编解码
2025年10月23日
实时音视频

【音视频】面试题集锦第 41 期

音视频面试题集锦第 41 期。涉及 AV1、vp8 和 vp9、优化播放器、hls 直播、转码、播放器秒开率和消息队列等方面知识。

RTC观主
2025年10月23日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第六章规划

本文是对《智能体设计模式》第六章的翻译。此章节介绍了规划（Planning）在智能体编程中的作用，以及如何结合规划功能进行设计。

AIGC
2025年10月23日
技术文章

Google AI 推出VISTA：一款用于文本转视频生成的测试时自我改进智能体

摘要：VISTA 是一种多智能体框架，可在推理过程中提升文本到视频的生成效果。该方法将结构化提示规划为场景，通过成对的比赛机制筛选最佳候选方案，运用视觉、音频及上下文领域的专业评判…

AIGC
2025年10月23日
实时音视频

火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight

近日，NeurIPS 2025公布了录用结果，该会议是机器学习与人工智能领域最具影响力的国际顶级学术会议之一。据悉本次会议共有21575篇投稿进入审稿阶段，最终5290篇论文被录用…

大厂Animal
2025年10月22日
即时通讯

基于 FastAPI WebSockets 与 Django 集成的实时聊天应用

实时通信已成为现代 Web 应用程序的基石。无论是构建客户支持聊天、协作工具还是社交平台，WebSocket 都能提供即时更新所需的双向通信。在本文中，我们将探讨如何使用 Fast…

IM开发老王
2025年10月22日
即时通讯

uni-app x 语音组件（ZIM Audio SDK）发布，轻松实现高清语音消息的收发

周一，ZEGO即构科技发布适配跨平台应用开发引擎 uni-app x 的语音组件——ZIM Audio SDK 1.0.5 版本，支持完整的语音处理功能，包含语音采集、播放、噪声抑…

ZEGO即构科技
2025年10月22日