技术文章
-
音视频开发之AudioEngine音频引擎
Audio Engine是一种数字信号处理器(DSP),用于将音频信号从一种形式转换为另一种形式。它通常被用于音频系统中,以处理音频信号,例如将模拟信号转换为数字信号,进行音频压缩…
-
Qt V4L2摄像头编程
V4L2(Video for Linux 2)是一个用于Linux操作系统的视频捕捉和输出框架。它提供了一组API和驱动程序接口,用于与摄像头设备进行交互和控制。 如果你想进行V4…
-
音视频开发之提取与解码(音视频基础知识)
提取与解码是两个很常见的概念,比如在自然语言处理中就有提取与解码,它们的英文名叫Extractor与Decoder。 Extractor和Decoder是自然语言处理领域中的两个重…
-
FFmpeg macOS硬件转码近似最优解
FFmpeg上的硬件加速涉及以下三块: hwcontext在硬件解码、硬件编码、硬件filter之间起到配置硬件、维护上下文、支持多种硬件加速API之间互操作的作用。如果不注意hw…
-
什么是人工智能语音发生器?人工智能语音发生器的工作原理和优势
随着越来越多的公司利用语音技术创造高效的客户服务体验和令人难忘的互动,语音技术也变得越来越流行。在当今的数字环境中,人工智能通常为语音技术提供动力,使计算机能够理解有声语言并作出反…
-
什么是ROIP网关?ROIP网关的特点和功能
ROIP(Radio over Internet Protocol)网关是一种用于将无线电通信(如对讲机、无线电台)与互联网或IP网络集成的设备或系统。ROIP网关的主要功能是将传…
-
VoIP 路由及其对通话质量的影响
网络电话(VoIP)彻底改变了企业的通信方式。通过将语音呼叫转换成数据包并在互联网上传输,VoIP 提供了一种灵活、经济高效的通信解决方案。这项技术的一个重要组成部分是 VoIP …
-
D3T:Deadline-aware的实时视频流传输控制框架 | ICNP 2021
近年来,实时应用程序的截止日期要求迅速增加(例如云游戏、云虚拟现实、在线会议)。由于网络条件的多样性,满足这些应用程序的截止日期要求已成为研究的热点之一。然而,当前的方案主要关注提…
-
Android录制视频,软编实现音视频的录制
软编实现音视频录制 前言 之前的硬编我们可以基于 Android 官方提供的 MediaCodec 来实现编码,基本上可以做到一边录制一边编码并封装为MP4文件。 速度肯定是更快的…
-
音视频面试题集锦 2023.09
下面是 2023.09 月音视频面试题集锦的几条干货精选: 1、PCM 音频数据是怎么组织的? 1)数据生成 模拟数据 → 采样 → 量化 → 编码 → 数字信号 2)数…
-
音视频学习–Raw格式引起的图像问题
您是否曾经尝试解决一个小问题却发现自己意外地解决了一个更大的问题? 问题背景 最近研发小伙伴在预研新的产品,在系统正常运行起来之后,发现一个奇怪的问题:从图片来看,可能是图像处理过…
-
2D 特征跟踪 – 第 1 部分:检测
交通图像上检测到的关键点 你是否曾经想过手机是如何在视频中跟踪你的脸部随着你移动的呢?或者自动驾驶汽车如何保持对道路上其他车辆的跟踪?所有这些惊人的成就都是通过2D特征跟踪实现的,…
-
利用潜空间屏蔽技术提升机器的神经图像压缩能力 | TCSVT 2022
这篇文章主要介绍了一种基于深度学习网络的图像压缩框架,该框架并不把提升人类视觉质量作为最终目标,而是面向进行计算机视觉任务的机器并进行进行端到端的训练,最终得到了优于标准VVC的图…
-
如何使用 Next.js 、Typescript 和 Socket.io 构建简单的聊天应用程序?
要使用 Next.js、TypeScript 和 Socket.IO 制作一个简单的聊天应用程序,可以按照以下步骤操作: 1. 在终端运行以下命令,创建一个新的 Next.js 项…
-
Flutter直播示例源码及运行指引
本文分享即构Flutter直播示例源码,此示例源码向用户展示了 SDK 中的初始化、登录房间以及基础推拉流等功能。通过顺序阅读快速开始章节中的文档并参考示例代码,相信用户也能快速让…
-
西工大 ASLP 实验室在 WeNet 中开源基于 CPPN 的神经网络热词增强语音识别方案
语境偏置(Contextual biasing)旨在将语境知识集成到语音识别(ASR)系统中,以提高在相关领域词汇(俗称“热词”)上的识别准确率。在许多ASR场景中,待识别语音中可…
-
了解 HTTP 方法、Webhooks、Websockets 以及 HTTP 流实时通信的局限性
在网络开发领域,对网络通信的基本了解非常重要。HTTP 方法、webhooks 和 websockets 都是值得关注的核心概念。在本文中,我们将深入探讨这些概念,并通过实际案例来…
-
如何使用 Rust 和 OpenCV 构建实时网络摄像头流媒体服务器
在当今飞速发展的技术领域,实时多媒体流已成为我们数字体验中不可或缺的一部分。无论是视频会议、实时流媒体还是远程监控,实时捕获和流式传输视频帧的能力都是一项强大的功能。在本文中,我们…
-
如何从H.265视频编码器升级到H.266?
现在H.265软件编码器的压缩性能已经基本卷不动了吧,是否也该考虑考虑从下一代的H.266编码上来拿到更高的压缩收益了呢? 那从已有的H.265视频编码器升级到H.266视频编码器…
-
基于可解释贡献的轻量级稀疏自动编码器 | ICML 2023
随着深度学习模型变得越来越庞大,开发性能退化最小的轻量级模型至关重要。在本文中,作者提出了一种SHAP-SAE(SHapley Additive exPlanations base…