技术文章
-
Wi-Fi 7 有哪些优势?速度、容量和可靠性的新标准
为了满足企业日益增长的无线网络需求,Wi-Fi 技术正在飞速发展。办公室、酒店、商业场所和工业场所越来越需要能够深度集成到其运营中的无线网络。Wi-Fi 7 标准 (IEEE 80…
-
将视频融入播客的挑战与机遇
欧洲的播客行业正在蓬勃发展。据 Grand View Research 的数据显示,2024 年欧洲播客市场规模将超过 85 亿美元,预计未来几年的增长率将达到 25% 至 30%…
-
【音视频】MediaCodec 视频处理
这个系列文章我们来介绍一位海外工程师如何探索安卓音视频基础技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍 MediaCodec 视频处理。 ——来自公…
-
Qt 多媒体播放器深度解析:从 QMediaPlayer 到 FFmpeg 自定义播放架构
在使用 Qt 开发多媒体应用时,开发者常常会遇到一个令人困惑的问题:为什么明明是标准格式的 MP4 视频,在 QMediaPlayer 中却无法播放?本文将深入剖析 Qt 的多媒体…
-
Uni-MoE-2.0-Omni:基于开源Qwen2.5-7B的文本、图像、音频与视频理解全模态MoE模型
如何构建一个能够可靠理解文本、图像、音频和视频,同时仍能高效运行的统一模型?来自哈尔滨工业大学深圳分校的研究团队推出了 Uni-MoE-2.0-Omni,这里一款全开放式全模态大型…
-
Meta通过压缩元数据在Instagram上启用杜比视界HDR功能
通过与 FFmpeg 开发人员的技术合作以及 Dolby 规范,Instagram iOS 成为 Meta 首个支持 Dolby Vision 视频播放的应用。
-
面向规模化构建?为何现场体育直播需要m-ABR和视频专用CDN
随着苹果和亚马逊 Prime Video 等流媒体巨头激烈争夺体育赛事直播权,行业正面临一个新现实:广泛部署的流媒体传输基础设施是否已完全准备好支撑全球范围内的峰值观众流媒体需求?…
-
如何将 WhatsApp Business Calling API 与 WebRTC 集成以启用客户语音通话
直到最近,要在企业应用与 WhatsApp 超过 30 亿用户之间实现实时语音通话,仍需依赖复杂的电信基础设施。Meta 于 2025 年 7 月推出的 WhatsApp Busi…
-
如何构建类似 Jitsi Meet 的视频会议应用
随着远程办公和虚拟会议的普及,众多企业正寻求开发类似 Jitsi Meet 应用的自有视频会议解决方案。本文将带您了解如何借助全球领先的实时互动技术提供商 ZEGO 构建成功的视频…
-
2025 年四大 AI 浏览器对比:Atlas、Copilot Mode、Dia 和 Comet
AI 浏览器正将模型从“回答关于网络的问题”转向“在网络上操作”。在 2025 年,四款 AI 浏览器将定义这一领域:OpenAI 的 ChatGPT Atlas、搭载 Copil…
-
MediaCodec 音频处理
在 Android 多媒体开发领域,音频处理是许多应用的基础需求,从录音应用到视频流媒体平台皆是如此。AVSample 仓库通过 Android 的 MediaCodec API …
-
VisionWeaver:从“现象识别”到“病因诊断”,开启AI视觉幻觉研究新篇章
长久以来,我们只知道大型视觉语言模型(LVLM)会犯错,但始终缺乏一把“手术刀”,无法剖析其视觉感知的根源性缺陷。我们只知其然,不知其所以然。我们希望当 AI 模型观察图像时,不再…
-
携程数字人直播实战:成本降低90%,我们如何实现规模化落地?
本文将主要携程团队设计开发携程数字人直播产品的背景、方案调研、设计和研发过程中遇到的问题以及解决方案,同时也介绍了本产品的主要功能和未来的规划。
-
React Native如何接入直播功能(基于ZEGO React Native直播SDK开发)
使用 React Native 构建直播应用是为用户提供交互式实时体验的绝佳方式。React Native 的跨平台特性与丰富的库生态系统,使其成为开发流媒体应用的理想选择。无论您…
-
如何高效地在云端举办直播活动
众所周知,当今观众渴望随时随地通过互联网在任何设备上自由观看内容。同样公认的是,云技术为广播公司提供了亟需的灵活性和可扩展性,使其更易满足这些需求。然而云技术同样依赖 IP 网络,…
-
抛开炒作,看清5G:掌控体育赛事直播制作
5G 一直被宣传为将彻底改变直播行业的技术。其潜力显而易见,确实堪称直播制作中缺失的关键环节,但也面临着巨大的技术和商业挑战
-
关于未来语音技术和应用趋势的10点看法
在这个技术变革的时代,本文分享10点个人对于智能语音技术和应用在未来几年发展的看法。
-
视频流媒体效率 5 大支柱:如何更快上线、更智能扩展、更明智支出
对于当今的流媒体服务而言,运营效率已成为关键差异化因素,其核心不在于比特率或压缩技术,而在于平台架构设计、部署实施与扩展能力。随着云基础设施和 AI 增强流程的普及,竞争焦点正从功…
-
Meta AI 发布 Omnilingual ASR:一套支持1600 多种语言的开源语音识别模型
如何构建一个能够理解数千种语言(包括许多以前从未有过有效自动语音识别 (ASR )模型的语言)的语音识别系统? Meta AI 发布了 Omnilingual ASR,这…
-
AV1解码生态全景图
本文是截至2025年11月最完整详尽的 AV1 解码生态全景报告。AV1 编码标准凭借高效、免费、开放的核心优势,已在北美流媒体市场完成从技术迭代到生态落地的全面突破。