技术文章

技术文章

MPEG-H 和 Dolby Atmos 技术对比，广播公司更偏爱谁？

下一代音频 (NGA) 是一系列技术，它将音频从固定声道混音扩展到沉浸式、对象驱动和元数据驱动的体验，使其具有个性化、易用性和跨设备可扩展性。NGA 允许单个节目携带离散元素（声道…

音频技术
2025年12月3日
即时通讯

异步 Django：将 WebSocket 扩展至 100 万并发连接

本文讲述如何实现将 WebSockets 扩展至 100 万并发连接，踩了哪些坑，以及在扩展异步 Django 应用过程中汲取的经验教训。

IM开发老王
2025年12月1日
技术文章

AAAI 2026｜MARS：基于多模态检索和选择增强的对话LLM语音识别

随着以智能助手为代表的人机语音对话系统和会议转录与纪要等应用的爆发，对话语音识别（Conversational ASR）技术变得愈发重要。对话语音（Conversational …

AIGC
2025年12月1日
实时音视频

Android音视频性能优化技术

在资源有限的Android设备上进行音视频处理时，性能优化至关重要。AVSample项目展示了多项关键优化技术，可显著提升多媒体应用的性能。 1、原生库编译优化项目针对FFmpe…

RTC观主
2025年12月1日
技术文章

AI驱动的语音质量评分：衡量的不仅仅是MOS

在语音通信领域，通话质量不仅仅取决于技术规格，它直接反映了团队协作方式、客户服务体验以及企业日常运营。多年来，业界一直依赖平均意见得分 (MOS) 来衡量语音质量。尽管 MOS 确…

音频技术
2025年11月27日
实时音视频

揭秘并解决直播延迟问题(直播延迟怎么解决)

媒体和娱乐行业近期最引人注目的市场趋势之一是流媒体直播的增长。全球流媒体直播市场从 2022 年的 12.4 亿美元增至 2023 年的 14.9 亿美元，复合年增长率（CAGR）…

ZEGO即构科技
2025年11月27日
实时音视频

【音视频】原生媒体播放器实现

本文探讨 AVSample 项目中的原生媒体播放器实现，该实现展示了如何使用 Android 原生 API 构建高性能的音频和视频播放器。

RTC观主
2025年11月27日
实时音视频

播放器视频后处理实践（二）氛围模式

百度播放内核团队将氛围模式效果应用到了视频播放场景，用于提升用户观看视频沉浸感，同时在百度App、好看App两款产品完成上线。本文将详细说明视频场景氛围模式技术方案。

大厂Animal
2025年11月26日
实时音视频

【音视频】基于 Java 的媒体播放器

这个系列文章我们来介绍一位海外工程师如何探索安卓音视频基础技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，本篇介绍 Java 媒体播放器。 ——来自公众号“关键…

RTC观主
2025年11月26日
WebRTC

WebRTC在您离开时依然运行，Pion 中自动重选机制概述

视频通话的网络连接听起来很简单。你把视频发送到服务器，服务器再把视频发送回来。但这种思维模型在现实世界中会失效。一个最初在稳定的家庭Wi-Fi上建立的连接，可能会因为有人走出家门而…

webrtc学习和实践
2025年11月25日
即时通讯

即构科技 uni-app x 离线推送 SDK (ZPNs SDK v2.8.0 UTS 插件) 发布

2025年11月24日，即构科技 uni-app x 离线推送 SDK——ZPNs SDK v2.8.0 UTS 插件首次发布，支持接收 Apple、Google、华为、小米、OP…

ZEGO即构科技
2025年11月25日
即时通讯

利用 EMQX 消息队列解决关键物联网消息传递挑战

MQTT 的实时性优势在面对异步操作时显得捉襟见肘，这正是许多物联网项目变得复杂的根本原因。而基于 EMQX 消息队列功能，这种统一、高效的消息处理模式已成为现实。

IM开发老王
2025年11月25日
技术文章

什么是各向异性扩散？各向异性扩散优缺点

什么是各向异性扩散？各向异性扩散（Anisotropic Diffusion）是一种先进的图像处理技术，主要用于图像平滑和边缘保持。各向异性扩散（也称为Perona-Malik扩…

图像处理
2025年11月25日
技术文章

MPEG-I 沉浸式音频以 6DoF 音效革新 VR 和 AR 体验

在虚拟现实和增强现实快速发展的领域，音频长期以来一直处于视觉效果的次要地位。但随着MPEG-I沉浸式音频标准的出现，一场翻天覆地的变革正在发生。该标准有望彻底改变我们在数字领域体验…

音频技术
2025年11月25日
技术文章

什么是实时AI？实时AI的架构及应用场景

您的企业运用 AI 分析报告或划分客户群体，这极具价值。但若 AI 需要即时行动呢？我们谈论的是毫秒级的决策。部署必须即时响应的 AI 系统面临着完全独特的挑战。这不仅关乎准确性，…

实时互动
2025年11月25日
实时音视频

互动式 AI Agent 如何重塑直播互动体验

直播的本质始终在于连接。那种激动、活力与实时互动，正是赋予直播内容生命力的源泉。然而随着观众规模扩大、直播形式日益复杂，维系这种即时的人际联结变得前所未有的困难。每位主播都深有体…

ZEGO即构科技
2025年11月24日
技术文章

什么是小波压缩？小波压缩的优缺点

什么是小波压缩？小波压缩（Wavelet Compression）是一种图像压缩技术，它利用小波变换在保持图像质量的同时减小文件大小。与其他仅关注频率域或空间域变换的压缩技术不同…

图像处理
2025年11月24日
即时通讯

B站消息新架构升级

技术上数据量越大，降级概率越大，但消息业务场景上数据量大的是影响力更大的UP，业务不接受技术降级，如何破？如果消息流量增加10倍，怎么保障服务不挂？

大厂Animal
2025年11月21日
技术文章

什么是自适应阈值处理？图像处理中的自适应阈值处理

什么是自适应阈值处理？自适应阈值处理（Adaptive Thresholding）是一种图像处理技术，它根据局部像素强度将灰度图像转换为二值图像。与使用单一全局阈值不同，自适应阈…

图像处理
2025年11月21日
技术文章

Instantvir：实时视频逆问题求解器，提炼扩散先验实现超快速重建

实时重建高质量视频对从视频会议到增强现实等应用构成重大挑战，既要求视觉保真度又需极低延迟。来自北京大学、华侨大学和快手的研究团队通过 InstantViR 解决了这一难题。 Ins…

视频技术
2025年11月20日