技术文章
-
《Agentic Design Patterns:构建智能系统的实战指南》- 第十章 模型上下文协议
本文是对《智能体设计模式》第十章的翻译。此章节介绍了模型上下文协议(MCP协议)。
-
触手可及:触觉技术成为虚拟现场体验的核心
整个视频行业,尤其是体育行业,正在走向多模态化。随着行业将分辨率、动态范围和音频保真度提升至难以进一步变现的高度,单纯的画面和音频已无法满足需求。因此,业界正将目光投向能增强赛…
-
如何构建视频面试平台?
您是否了解一款能让招聘变得智能高效、不受地域限制的视频面试平台?该系统能更便捷快速地开展常规面试,助您发掘最优秀的候选人。若您想了解如何构建视频面试平台,本文将介绍其核心功能、使用…
-
常用 Web 实时通信技术:原理+选型,一篇通关
在 Web 开发中,实时通信技术的核心目标是实现客户端(Browser)与服务器之间低延迟、双向 / 单向的动态数据交互,而非传统 HTTP 的 “请求 – 响应” 模…
-
《Agentic Design Patterns:构建智能系统的实战指南》- 第九章 学习与适应
本文是对《智能体设计模式》第九章的翻译。此章节介绍了支撑智能体学习与适应的原理和机制。
-
非极客实时 AI 视频增强指南
本文分享 Pixop 的技术专家 Jon Frydensbjerg 眼中的 AI 视频增强。全文如下。 致真正的非技术人士:本文同样面向非技术读者,据说并非所有人都知道“精灵(Sp…
-
观点:IPMX 是否正在取代 ST 2110?
IPMX(IP Media Experience)会取代 SMTE ST 2110 吗? 不会,至少目前来说,它们针对的是不同的应用领域。IPMX是“简化版ST 2110(且可能更…
-
音视频面试题集锦第 42 期 | Android 音视频方向面试题实录
本文来自音视频技术社群关键帧的音视频开发圈的分享,该社群会定期整理一些音视频相关的面试题,本期分享 Android 音视频方向面试题实录。 下面是我们技术社群的一位群友最近面试 J…
-
《Agentic Design Patterns:构建智能系统的实战指南》- 第八章 内存管理
本文是对《智能体设计模式》第八章的翻译。此章节介绍了智能体系统的内存管理机制。
-
Liquid AI 发布 LFM2-VL-3B,为边缘设备带来 3B 参数的视觉语言模型
Liquid AI 发布了 LFM2-VL-3B,这是一个用于图像文本到文本任务的 3B 参数视觉语言模型。它扩展了 LFM2-VL 系列,使其超越了 450M 和 1.6B 版本…
-
基于 SRT 协议的安全推流整合方案在云手机产品中的应用
为落实国家“十四五”数字经济与新型基础设施建设规划,遵循数据安全法和个人信息保护法的相关要求,推动云手机安全传输技术国产化与标准化,针对云手机音视频流传输的高丢包、低安全与延迟等问…
-
【音视频】媒体播放器缓冲策略
这个系列文章我们来介绍音视频相关面试题,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍媒体播放器缓冲策略。 ——来自公众号“关键帧Keyframe”的分享 …
-
《Agentic Design Patterns:构建智能系统的实战指南》- 第七章 多智能体协作
本文是对《智能体设计模式》第七章的翻译。此章节介绍了多智能体协作和通信的内容,以及如何进行相关设计。
-
视频编码标准中的随机访问(random access)
每当你在视频流中跳转到想要的场景、在稍后时间继续观看电影、切换电视频道,或是加入已经开始的视频会议时,你都在使用一种名为随机访问(random access)的视频解码功能。
-
【音视频】面试题集锦第 41 期
音视频面试题集锦第 41 期。涉及 AV1、vp8 和 vp9、优化播放器、hls 直播、转码、播放器秒开率和消息队列等方面知识。
-
《Agentic Design Patterns:构建智能系统的实战指南》- 第六章 规划
本文是对《智能体设计模式》第六章的翻译。此章节介绍了规划(Planning)在智能体编程中的作用,以及如何结合规划功能进行设计。
-
Google AI 推出VISTA:一款用于文本转视频生成的测试时自我改进智能体
摘要:VISTA 是一种多智能体框架,可在推理过程中提升文本到视频的生成效果。该方法将结构化提示规划为场景,通过成对的比赛机制筛选最佳候选方案,运用视觉、音频及上下文领域的专业评判…
-
火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight
近日,NeurIPS 2025公布了录用结果,该会议是机器学习与人工智能领域最具影响力的国际顶级学术会议之一。据悉本次会议共有21575篇投稿进入审稿阶段,最终5290篇论文被录用…
-
基于 FastAPI WebSockets 与 Django 集成的实时聊天应用
实时通信已成为现代 Web 应用程序的基石。无论是构建客户支持聊天、协作工具还是社交平台,WebSocket 都能提供即时更新所需的双向通信。在本文中,我们将探讨如何使用 Fast…
-
uni-app x 语音组件(ZIM Audio SDK)发布,轻松实现高清语音消息的收发
周一,ZEGO即构科技发布适配跨平台应用开发引擎 uni-app x 的语音组件——ZIM Audio SDK 1.0.5 版本,支持完整的语音处理功能,包含语音采集、播放、噪声抑…