技术文章
-
GPU 与 TPU 哪个更适合 AI 工作负载?
随着人工智能的兴起,对能够支持复杂计算的更高性能硬件加速器的需求也在增长。其中有用的加速器包括图形处理单元 (GPU) 和张量处理单元 (TPU)。每种加速器都有其优势,了解这些差…
-
如何理解 Vulkan 同步机制
Vulkan 的同步机制用于控制 GPU 和 CPU 之间的任务执行顺序,确保资源的正确访问顺序和任务的按序执行。 由于 Vulkan 是高度并发的 API,需要明确管理同步,防止…
-
使用 FFmpeg 在 Go 中进行视频压缩
作为一名开发人员,没有什么比将繁琐的任务自动化更令人满意了。如果您要处理视频和音频,FFmpeg 就可以派上用场,但如果我们能直接从 Go 应用程序中控制它,那又会怎样呢?本篇文章…
-
WebRTC 完美协商
本文将讨论如何通过在两个对等方(peers)之间建立连接时消除竞争条件来实现完美协商,假设我们已经建立了一个信令服务器。 协商是一种非对称操作,一方作为 “调用者”,另一方作为 “…
-
InstructG2I:一种基于图形上下文感知的稳定扩散模型,用于从多模态属性图中合成图像
多模态属性图 (MMAG) 尽管在图像生成方面用途广泛,但并未受到太多关注。MMAG 以图形结构的方式表示具有组合复杂性的实体之间的关系。图中的节点包含图像和文本信息。与文本或图像…
-
JD Voice Assistant:一个Python打造的跨平台智能语音助手
JARVIS Desktop Voice Assistant 是由众多开发者基于python开发的一个开源桌面语音助手,有人又在它的基础上开发了一个中文版的Jarvis,支持中文对…
-
CBR 与 VBR – 恒定和动态比特率流媒体之间的区别
CBR(恒定比特率)和 VBR(动态比特率)是两种不同的码率控制方法,用于通过 Internet 流式传输视频的视频编码。顾名思义,CBR 旨在保持比特数不变,同时牺牲视频质量,而…
-
在 iPad 上调试 WebRTC
如何在 iPad 上调试 WebRTC?本文介绍了为什么现在需要在 iPad 上 Safari 以外的浏览器上测试应用程序?以及基于 Apple 的开发设置,如何设置远程调试。
-
亚马逊生成式 AI 购物助手 Rufus 背后的技术!
Rufus 可以回答亚马逊购物应用中的各种问题,从商品详情、商品比较到推荐,帮助亚马逊客户做出更明智的购物决策。它的存在得益于人工智能的进步和创新。
-
关于SRS流媒体服务器的重要缺陷的总结
在流媒体服务器开源项目中,SRS[1]是一个使用挺广泛的开源项目,维护的时间也比较久,从2013年开始,陆陆续续解决了一些问题,但始终有些问题不容易解决,这篇文章总结和分享给大家。…
-
如何消除 OpenSIPS 中的僵尸注册
注册过程是 SIP 的一个重要机制。它允许用户与服务取得联系,公布自己的位置,并接收来自服务的呼叫。 SIP 服务的健康状况及其性能取决于注册过程的运行状况以及注册信息的准确性和最…
-
GLSL 着色器语言入门教程(珍藏版)
GLSL(OpenGL Shading Language)是一种用于 OpenGL 图形 API 的着色语言,专门用于编写顶点着色器和片段着色器(像素着色器)的代码,GLSL 采用…
-
如何使用 FFmpeg 对 MV-HEVC 视频进行编码
如何将 3D 立体视频编码为 MV-HEVC 空间视频,以及如何将 MV-HEVC 空间视频解码为 3D 立体并排视频。 作者:Zachary Handshoe 在 Spatial…
-
使用 FFMPEG 降低比特率
FFMPEG 实用程序用于修改媒体文件。我们将学习如何降低视频文件的比特率。 使用以下命令: 在我们的例子中,源文件名为 input.mp4,输出文件名为 output.mp4,目…
-
OpenAI 和 LiveKit 合作将高级语音转变为 API
LiveKit 和 OpenAI 正在合作,帮助您使用支持 ChatGPT 新的高级语音功能的相同技术构建自己的应用程序。
-
使用 React 和 Express 以及 Socket.io 和点对点连接创建视频通话应用程序
在本文中,我们将使用 Socket.io 和 Peer-to-Peer 库在 React 和 Express 之间为视频通话应用程序建立连接。 设置后端 1. 安装必要的软件包 2…
-
NVIDIA AI 推出 FACTS:基于 RAG 的企业聊天机器人综合框架
在当今快速发展的环境中,企业聊天机器人正成为提高员工工作效率的重要工具,它能让员工快速获取组织知识。然而,构建有效、可扩展且安全的检索增强生成 (RAG) 系统的过程充满挑战。NV…
-
LOONG:一款基于自回归 LLM 的新型视频生成器,可生成长达一分钟的视频
利用自回归大语言模型(LLM) 生成视频是一个新兴领域,发展前景广阔。虽然 LLM 在自然语言处理中生成连贯且冗长的标记序列方面表现出色,但它们在视频生成中的应用仅限于几秒钟的短视…
-
如何在不降低质量的情况下缩小视频尺寸?
随着互联网的发展,视频流媒体服务越来越受欢迎。通过提供简短、生动的视频概述您的操作,这是推销产品或服务的好方法。但当您导出最终视频时,却发现视频文件太大,无法上传到网站或直播流媒体…
-
音视频面试题集锦第 30 期
分享来自音视频技术社群关键帧的音视频开发圈的第 30 期面试题精选: 1、为什么自制的动态图片导出到相册无法识别成动态图片? Live Photo 需要有一个特殊的 Metadat…