技术文章
-
从视频编解码角度看Sora视频
要问2024年什么技术话题最火爆,那必须是OpenAI的Sora莫属了。虽然Sora还尚未公布对公众何时开放使用,但似乎并妨碍大家的讨论热情。 Sora的厉害之处在于它可以根据用户…
-
ELECARD 视频压缩手册第三章:HEVC中的空间(帧内)预测
本文是对 ELECARD Video Compression Book 第三章的翻译。本章节的内容包括消除视频图像中的时间或空间冗余的可能方法、HEVC中图像处理的逐块基础、空间预…
-
打开 Camera app 出图,前几帧图像偏暗、偏色该怎样去避免?
1、问题背景 使用的安卓平台,客户的应用是要尽可能快的获取到1帧图像效果正常的图片。 但当打开 camera 启动出流后,前3-5帧图像是偏暗、偏色的,如下图所示,是抓取出流的前2…
-
面向多种阵列拓扑的多通道语音识别模型:自动通道选择和空间特征融合 | ICASSP2024
多通道语音识别(Multi-channel ASR)的目标是识别由多个麦克风(如麦克风阵列)拾取的多通道音频,相较于标准的单通道语音识别,多通道语音识别通过有效利用多通道信号提供的…
-
OpenCV分享:计算机视觉研究不同阶段,如何发表研究成果
在之前的博文中,OpenCV分享了包括朴素起源,背后机制,任务,以及领先品牌如何利用其潜力来推动其业务向前发展等的计算机视觉基础知识,以及成为计算机视觉工程师的指南。 在新一篇博文…
-
UDP 与 RTP 实现高效的音视频通信
协议确定了双方通信的规则和流程。在互联网的协议集中,有一种无连接的传输协议,被称为用户数据报协议(UDP,User Datagram Protocol)。 UDP 为应用程序提供了…
-
WebRTC中的ICE流程介绍
WebRTC 作为一项通讯技术,建立通讯连接的过程是其中很重要的部分。在webrtrc中采用了ICE(Interactive Connectivity Establishment)…
-
ELECARD 视频压缩手册第二章:HEVC 中的帧间预测
内容摘要:本文是对 ELECARD Video Compression Book 第二章的翻译。本章节介绍了 HEVC 中帧间编码所用技术。 标题:Inter-frame pred…
-
什么是自动呼叫分配 (ACD)?人工智能驱动的自动呼叫分配指南
想象一下,你正在经营一家电信公司。你知道该怎么做:客户打来电话,希望得到快速答复,并尽量缩短等待时间。但随着呼叫量激增,您该如何跟上?人工智能驱动的自动呼叫分配(ACD)将改变您的…
-
开发人员构建元宇宙的 15 个工具和框架
元宇宙是数字领域正在兴起的一个新概念。它曾一度局限于科幻小说和推测性想象的领域,如今正成为有形的现实。得益于开发者的智慧和技术的进步,元宇宙被定义为一个集体虚拟共享空间。它超越了传…
-
FFmpeg 如何添加静态和动态水印
FFmpeg 是一款流行的开源工具,非常适合处理视频、图像和音频。视频编辑器的一项常见任务是在视频中添加水印,这有助于保护知识产权或提供品牌效应。只需几行命令,FFmpeg 就能轻…
-
AAAI2024 基于异构图上下文建模实现对话语音合成的情感渲染 | 论文分享
本次分享内蒙古大学S2LAB与字节跳动、港中文(深圳)合作,关于情感对话语音合成的工作《Emotion Rendering for Conversational Speech Sy…
-
OpenGL 计算着色器(Compute Shader )你用过吗?
Compute Shader 是 OpenGL ES(以及 OpenGL )中的一种 Shader 程序类型,用于在GPU上执行通用计算任务。 与传统的顶点着色器和片段着色器不同,…
-
WebRTC 音频的编码与发送逻辑
大家好,今天分析下音频的编码与发送逻辑。 音频发送模块AudioSendStream 通过call模块创建AudioSendStream,创建时需要先初始化音频的配置参数 通过ca…
-
Flutter 应用程序中的聊天 UI
您是否曾发现自己在开发一个看似简单的聊天功能时犹豫不决,最终被数周的重复工作所吓倒?在现代应用程序中无处不在的聊天功能的实施任务往往被低估,导致开发人员和客户都感到沮丧。这一挑战凸…
-
ELECARD 视频压缩手册第一章:视频编码简述
本文是对 ELECARD Video Compression Book 第一章的翻译。本章节包括视频压缩技术的基本信息:简要历史、视频编码的阶段、AVC/H.264和HEVC/H….
-
使用 FFmpeg 调整图像或视频的亮度和对比度
FFmpeg 是一款功能强大的音频和视频文件处理工具。您可能想用 FFmpeg 执行的常见任务之一是用 FFmpeg 调整视频或图像的亮度和对比度。要做到这一点非常容易,因为 FF…
-
AI 在优化视频流 CDN 方面有哪些优势?
将人工智能集成到 CDN 视频流战略中具有显著优势,包括优化视频质量、增强观众体验和卓越的安全措施。通过动态调整视频参数和个性化内容交付,人工智能可确保观众根据自己的喜好和网络条件…
-
如何在 Web/H5 端开播弹幕游戏(主播在浏览器开播弹幕游戏)
本文介绍,主播如何通过小游戏平台(ZEGO MiniGameEngine SDK)和实时音视频(ZEGO Express SDK)在 Web/H5 端开播弹幕游戏。 开播弹幕游戏条…
-
优化回声消除过程:AEC Challenge冠军方案线性部分解析
今天我们继续介绍回声消除的优化,在前面优化回声消除过程:舒适噪声生成算法的应用与原理我们介绍了回声消除中的舒适噪声是如何产生的,这里我们介绍下线性部分的优化。我们知道在WebRTC…