技术文章

实时音视频

2025 年的 7 大视频通信趋势

随着远程办公、在线学习和实时互动的不断发展，视频通信正变得更加沉浸式、智能化，并由人工智能驱动。在本文中，我们将探讨 2025 年的 7 大视频通信趋势，从生成式人工智能和空间音频…

ZEGO即构科技
2025年4月21日
技术文章

如何为 Flutter（Android 和 iOS）本地编译 FFmpeg 二进制文件

FFmpeg Flutter Kit 软件包已停用，预编译的二进制文件也已移除。这意味着开发者现在需要在本地编译 FFmpeg 二进制文件才能在 Flutter 应用中使用它们。在…

FFmpeg笔记
2025年4月21日
技术文章

Google Store 如何利用 glTF 3D 模型改变产品教育

本文研究探讨了 Google 如何利用 glTF 改进产品教育、降低成本、简化工作流程，同时提升 3D 内容创作的水平。

图像处理
2025年4月21日
WebRTC

开源SIP-WebRTC终端/服务器端/维护端项目多维度对比分析

这是一个开源的时代，开源共享是一种理想国。事实上，因为开源软件种类太多，大部分用户出现了选择困难。选型失败，结果也必然失败，最终产品也必然失败。做正确的事情，用正确的方法做事情。为…

webrtc学习和实践
2025年4月21日
实时音视频

探索 ExoPlayer 音视频播放技术（8）：插入广告

这个系列文章我们来介绍一位海外工程师如何探索 ExoPlayer 音视频播放技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，这是第 8 篇：ExoPlayer …

RTC观主
2025年4月21日
技术文章

Meta AI 发布感知语言模型 (PLM)：用于解决视觉识别难题的开放式可复制视觉语言模型

尽管视觉语言建模取得了快速发展，但该领域的大部分进展都源于基于专有数据集训练的模型，这些模型通常依赖于闭源系统的提炼。这种依赖阻碍了科学的透明度和可重复性，尤其是在涉及细粒度图像和…

AIGC
2025年4月21日
技术文章

2025 年实施新编解码器需要考虑的关键因素

在流媒体行业向新编解码器过渡绝不是一件轻而易举的事情，必须仔细考虑带宽节省、编码效率和质量提升等问题，并在确保为使用各种传统设备的最广泛观众提供播放能力的挑战之间取得平衡。Radi…

编解码
2025年4月18日
实时音视频

探索 ExoPlayer 音视频播放技术（7）：下载媒体

这个系列文章我们来介绍一位海外工程师如何探索 ExoPlayer 音视频播放技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，这是第 7 篇：ExoPlayer …

RTC观主
2025年4月18日
技术文章

MV-HEVC 会为扩展现实和元宇宙加速发展吗？

娱乐的下一个前沿在于互动式沉浸式体验，传统的电视和设备屏幕将让位于环绕观众的丰富3D环境。虽然视频压缩技术可能不会成为头条新闻，但它是3D视频内容创作和交付的支柱，能够实现扩展现实…

虚拟现实
2025年4月17日
实时音视频

探索 ExoPlayer 音视频播放技术（6）：轨道选择

这个系列文章我们来介绍一位海外工程师如何探索 ExoPlayer 音视频播放技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，这是第 6 篇：ExoPlayer …

RTC观主
2025年4月17日
技术文章

利用迭代细化，Loop-Residual 神经网络显示出与更大的 GPT-2 变体相当的结果

Transformer 架构彻底改变了自然语言处理，使 GPT 等模型能够高效地预测序列中的下一个 token。然而，这些模型存在一个根本性的局限性，即需要对所有之前的 token…

AIGC
2025年4月17日
技术文章

腾讯蝉联2025 MSU 4K 视频编码器大赛第一名，领跑 4K 编码赛道

编解码技术是音视频领域不可或缺的核心，它既是数据流通的“翻译官”，也是体验优化的“守门人”。 2025年4月14日，由莫斯科国立大学举办的 MSU 4K 视频编码器大赛结果揭晓。在…

编解码
2025年4月16日
技术文章

Seedream 3.0 文生图模型技术报告发布

字节跳动 Seed 团队正式发布 Seedream 3.0 技术报告。Seedream 3.0 是一个原生高分辨率、支持中英双语的图像生成基础模型，对比 Seedream 2.0，…

大厂Animal
2025年4月16日
技术文章

Deepgram 推出 Aura-2：专业且具备成本效益的企业级文本转语音模型

面向企业用例的语音 AI 平台 Deepgram 昨天发布了下一代文本到语音（TTS）模型Aura-2，该模型专为关键任务业务环境中的实时语音应用而设计。 Aura-2专为实现清晰…

AIGC
2025年4月16日
实时音视频

探索 ExoPlayer 音视频播放技术（5）：媒体源

这个系列文章我们来介绍一位海外工程师如何探索 ExoPlayer 音视频播放技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，这是第 5 篇：ExoPlayer …

RTC观主
2025年4月16日
实时音视频

探索 ExoPlayer 音视频播放技术（4）：媒体项

这个系列文章我们来介绍一位海外工程师如何探索 ExoPlayer 音视频播放技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，这是第 4 篇：ExoPlayer …

RTC观主
2025年4月15日
技术文章

ServiceNow AI 发布 Aprilel-5B，以更少的资源超越更大的 LLM

随着语言模型的规模和复杂性不断增长，训练和部署它们所需的资源需求也随之增长。虽然大规模模型可以在各种基准测试中取得卓越的性能，但由于基础设施的限制和高昂的运营成本，许多组织往往无法…

AIGC
2025年4月15日
实时音视频

探索 ExoPlayer 音视频播放技术（3）：播放列表

这个系列文章我们来介绍一位海外工程师如何探索 ExoPlayer 音视频播放技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，这是第 3 篇：ExoPlayer …

RTC观主
2025年4月14日
技术文章

NVIDIA AI 发布 UltraLong-8B：超长上下文语言模型，旨在处理大量文本序列

大型语言模型 LLM 在各种文本和多模态任务中展现出卓越的性能。然而，许多应用，例如文档和视频理解、上下文学习以及推理时间扩展，都需要能够处理和推理长序列的标记。LLM 有限的上下…

AIGC
2025年4月14日
技术文章

JPEG AI 模糊了真实与合成之间的界限

今年 2 月，JPEG AI 国际标准发布，经过数年的研究，该标准旨在利用机器学习技术，在不降低感知质量的前提下，生成更小、更易于传输和存储的图像编解码器。这一事件很少成为头条新…

图像处理
2025年4月11日

1 / 209
1
2
3
4
5
6
下一页