技术文章
-
FFmpeg前端视频合成实践
视频合成能力的开发背景 想要开发一个具有视频合成功能的应用,从原理层面和应用层面都有一定的复杂度。原理上,视频合成需要应用使用各种算法对音视频数据进行编解码,并处理各类不同音视频格…
-
一次直播和图像识别技术应用的探索之旅
背景 Think Better。 很多行业都在“卷”,作为金融科技行业的信也,也不例外。除了卷云计算、大数据和人工智能这些非常有深度的技术以外,信也向着技术融合创新的方向逐步探索,…
-
如何为visionOS准备和提供视频内容 | WWDC2023
本文将介绍使用 HLS(HTTP Live Streaming) 为 visionOS 准备和交付视频内容的方法。我们将深入了解 HLS 媒体交付流程,并探索如何扩展交付管道以支持…
-
如何开发类似 WhatsApp 的聊天应用程序
即时通讯应用程序已成为我们日常生活中的主要工具。WhatsApp 就是这样一款广受欢迎的应用程序,它拥有友好的用户界面、丰富的功能和实时通信特性。创建像 WhatsApp 这样的聊…
-
如何使用FFmpeg实现无人直播带货
什么是无人直播? 无人直播是指提前录制好直播内容,然后在直播过程中循环播放这些录制好的视频,以达到24小时不间断直播的效果。这种方式可以节省人力和物力成本,实现低成本引流、卖货以及…
-
2024 年 Web 开发十大前端框架
在快节奏的 Web 开发世界中,掌握最新的前端框架对于创建稳健高效的 Web 应用程序至关重要。前端框架在实现这一目标的过程中发挥着举足轻重的作用,它为开发人员提供了创建响应式、交…
-
ELECARD 视频压缩手册第四章:HEVC中的运动补偿
本文是对 ELECARD Video Compression Book 第四章的翻译。本章节介绍了HEVC 中的运动矢量预测算法:参考图像信息和运动矢量预测。 题目:Motion …
-
从视频编解码角度看Sora视频
要问2024年什么技术话题最火爆,那必须是OpenAI的Sora莫属了。虽然Sora还尚未公布对公众何时开放使用,但似乎并妨碍大家的讨论热情。 Sora的厉害之处在于它可以根据用户…
-
ELECARD 视频压缩手册第三章:HEVC中的空间(帧内)预测
本文是对 ELECARD Video Compression Book 第三章的翻译。本章节的内容包括消除视频图像中的时间或空间冗余的可能方法、HEVC中图像处理的逐块基础、空间预…
-
打开 Camera app 出图,前几帧图像偏暗、偏色该怎样去避免?
1、问题背景 使用的安卓平台,客户的应用是要尽可能快的获取到1帧图像效果正常的图片。 但当打开 camera 启动出流后,前3-5帧图像是偏暗、偏色的,如下图所示,是抓取出流的前2…
-
面向多种阵列拓扑的多通道语音识别模型:自动通道选择和空间特征融合 | ICASSP2024
多通道语音识别(Multi-channel ASR)的目标是识别由多个麦克风(如麦克风阵列)拾取的多通道音频,相较于标准的单通道语音识别,多通道语音识别通过有效利用多通道信号提供的…
-
OpenCV分享:计算机视觉研究不同阶段,如何发表研究成果
在之前的博文中,OpenCV分享了包括朴素起源,背后机制,任务,以及领先品牌如何利用其潜力来推动其业务向前发展等的计算机视觉基础知识,以及成为计算机视觉工程师的指南。 在新一篇博文…
-
UDP 与 RTP 实现高效的音视频通信
协议确定了双方通信的规则和流程。在互联网的协议集中,有一种无连接的传输协议,被称为用户数据报协议(UDP,User Datagram Protocol)。 UDP 为应用程序提供了…
-
WebRTC中的ICE流程介绍
WebRTC 作为一项通讯技术,建立通讯连接的过程是其中很重要的部分。在webrtrc中采用了ICE(Interactive Connectivity Establishment)…
-
ELECARD 视频压缩手册第二章:HEVC 中的帧间预测
内容摘要:本文是对 ELECARD Video Compression Book 第二章的翻译。本章节介绍了 HEVC 中帧间编码所用技术。 标题:Inter-frame pred…
-
什么是自动呼叫分配 (ACD)?人工智能驱动的自动呼叫分配指南
想象一下,你正在经营一家电信公司。你知道该怎么做:客户打来电话,希望得到快速答复,并尽量缩短等待时间。但随着呼叫量激增,您该如何跟上?人工智能驱动的自动呼叫分配(ACD)将改变您的…
-
开发人员构建元宇宙的 15 个工具和框架
元宇宙是数字领域正在兴起的一个新概念。它曾一度局限于科幻小说和推测性想象的领域,如今正成为有形的现实。得益于开发者的智慧和技术的进步,元宇宙被定义为一个集体虚拟共享空间。它超越了传…
-
FFmpeg 如何添加静态和动态水印
FFmpeg 是一款流行的开源工具,非常适合处理视频、图像和音频。视频编辑器的一项常见任务是在视频中添加水印,这有助于保护知识产权或提供品牌效应。只需几行命令,FFmpeg 就能轻…
-
AAAI2024 基于异构图上下文建模实现对话语音合成的情感渲染 | 论文分享
本次分享内蒙古大学S2LAB与字节跳动、港中文(深圳)合作,关于情感对话语音合成的工作《Emotion Rendering for Conversational Speech Sy…
-
OpenGL 计算着色器(Compute Shader )你用过吗?
Compute Shader 是 OpenGL ES(以及 OpenGL )中的一种 Shader 程序类型,用于在GPU上执行通用计算任务。 与传统的顶点着色器和片段着色器不同,…