技术文章
-
解读OpenAI Sora文生视频技术原理
以下文章来源于清熙 ,作者王庆法。 OpenAI Sora文生视频(图像看作单帧视频)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗…
-
如何使用 FFmpeg 调整音量(包括音量、DRC、标准化)
FFmpeg 是一款功能强大的音频和视频文件处理工具。您可能想用 FFmpeg 执行的常见任务之一是调整音频流或视频文件的音量。用 FFmpeg 来做这件事非常简单,它还包括处理音…
-
如何使用 FFmpeg 批量转换文件夹内的所有文件
FFmpeg 是一款功能强大的工具,可对音频和视频文件执行各种操作,如转码、过滤、编辑和流式传输。本文将向你展示如何使用 FFmpeg 批量转换或转换文件夹内的所有文件,并介绍一些…
-
WebRTC 传输之 TURN
1 TURN 要解决的问题 在 TCP/IP 网络中,一个常见的问题就是如何让两台处于内网的主机进行通信,即 NAT 穿越问题。解决 NAT 穿越问题的两个关键是: 举个例子, A…
-
.NET 8 中使用 WebSocket 实现实时聊天功能
使用 HTTP 实现近实时通信的技术有很多,如轮询、长轮询、服务器发送事件,甚至 Webhooks。 所有方法都有一个共同的问题 —— 它们仅限于单向通信。 在本文中,我们将探讨 …
-
Sora: 作为世界模拟器的视频生成模型
OpenAI新提出了一种功能强大的视频生成大模型,采用tansformer结构处理视频图像的时空块,支持不同长度、不同分辨率和不同长宽比的视频生成。其中最大的Sora模型支持长达一…
-
WebRTC 常见问题和错误信息
WebRTC (Web Real-Time Communication)是一项功能强大的技术,可实现浏览器与应用程序之间的实时通信。 然而,与其他技术一样,它也会遇到各种问题并产生…
-
IoT物联网协议有哪些?一看吓一跳
物联网协议是指在物联网环境中用于设备间通信和数据传输的协议。根据不同的作用,物联网协议可分为传输协议、通信协议和行业协议。 1. 传输协议 协议 协议描述和应用场景 Mo…
-
如何使用 FFmpeg 加速或减慢视频速度
在本文中,我们将介绍如何使用 FFmpeg 加快或减慢视频的速度。无论您是视频编辑者、处理媒体文件的开发人员,还是对视频操作充满好奇的爱好者,您都会发现本指南的价值。 我们将从在系…
-
OpenCV与FFmpeg的关系、互补性及使用选择
OpenCV(开源计算机视觉库)和 FFmpeg 是两个广泛使用的开源库,它们在图像和视频处理领域各有所长,常常被用于协同工作。 OpenCV 功能与技术背景: OpenCV是一个…
-
无线切片能力验证及应用探讨
摘 要:切片能够将网络资源灵活分配,将网络能力灵活组合。介绍了切片在无线侧的3 种实现机制:基于 QoS、基于 RB 资源预留、基于载波隔离。对切片和切片组的网络性能进行了验证。结…
-
为什么要选择 React Native 开发聊天应用程序?
选择 React Native 进行聊天应用程序开发,可使用单一代码库轻松构建跨平台应用程序,确保高效和快速部署,同时提供类似本地的用户体验。 React Native 可让您快速…
-
自带运营商 (BYOC)是什么意思?BYOC 的工作原理、优点、挑战和未来
在过去的几年里,通信领域发生了巨大的变化。目前,企业正在采用创新战略,通过各种渠道和平台与客户和同事进行沟通。基于统一通信的平台现已成为大多数灵活品牌的通信环境焦点,可能是最重要的…
-
语音用户界面:重新定义客户互动
语音用户界面(VUI)、语音搜索和其他基于语音的用户体验(UX)技术正在重塑我们的世界,并彻底改变我们的交互方式。 目前,技术和流程开发的主要重点都围绕着提升用户体验。语音交互旨在…
-
Android 使用 WebSocket 实现实时聊天
我曾有过这样的想法:WebSocket 是一种很难理解的东西,这种实时的东西需要我花一些时间来学习,而且不会那么容易,所以这个周末我尝试了一下,结果发现非常简单。因此,如果你和我一…
-
使用 Flask、OpenCV 和 WebRTC 构建直播应用程序
在本教程中,我们将探索如何将 Flask、OpenCV 和 WebRTC 简单而强大地结合起来,创建一个流媒体直播应用程序。无论您是初学者还是经验丰富的开发人员,本教程都将一步步指…
-
Elixir WebRTC 简介
在过去的几个月里,我们一直在非常努力地开发 W3C WebRTC 规范的 Elixir 实现,现在我们很高兴地正式宣布它的第一个版本 —— ex_webrtc 的 0.1 版本! …
-
Media over QUIC Transport(MOQT)协议概览-低时延可扩展的实时媒体流传输协议
这是一个短视频,实时视频,视频会议的时代。在日常生活中,无论是工作场景,娱乐还是日常沟通大家都频繁使用了视频的形式来进行沟通。用户的需求量在不断增加,而且要求更稳定,高质量的服务,…
-
SELM: 基于离散表征和语言模型的语音增强 | ICASSP2024
语音增强 (Speech Enhancement) 旨在从噪声和混响等多种干扰中恢复并提升语音的质量及可懂度,以提升人耳听感和语音识别率。在深度学习的推动下,基于神经网络的语音增强…
-
音视频面试题集锦第 16 期:关于音视频采集及OpenGL相关等
继续分享来自“关键帧的音视频开发圈”的音视频面试题集锦,下面是第 16 期面试题精选: 1、谈谈 iOS 音视频采集相关接口和数据结构的设计? 1)整体框架 通常我们通过 AVCa…