技术文章
-
LM4LV:用于低级视觉任务的冻结大型语言模型
大语言模型(LLM)的成功促进了多模态大语言模型(MLLM)的新研究趋势,改变了计算机视觉各个领域的范式。尽管 MLLM 在许多 high-level vision 和 visio…
-
前端直播功能开发(React/Next/Vue/Angular等框架),请务必收下这篇教程
近年来,前端开发框架层出不穷,根据 2023 年 GitHub 上全球 npm 累计下载量数据显示,React、Next、Vue、Angular 和 Preact 占据前五位[1]…
-
音视频面试题集锦第 24 期 | 直播相关技术指标优化
继续分享来自音视频技术社群关键帧的音视频开发圈的音视频面试题集锦第 24 期。 下面是第 24 期面试题精选,我们来讲讲直播相关技术指标优化的面试题: 1、直播打开成功率如何优化?…
-
在 Vuejs 中集成 WebRTC
在 Vue.js 中集成 WebRTC 的示例代码会涉及到多个步骤,包括创建 Vue 组件、获取媒体流、建立RTCPeerConnection、处理信令交换等。以下是一个简化的 V…
-
如何开发类似 Tango 的直播和视频聊天应用程序
直播和视频聊天应用程序已成为社交媒体生态系统的重要组成部分,使用户能够实时联系、分享和参与。Tango 是一个领先的实时社交社区,在全球拥有 4 亿多用户,深受各地用户的喜爱。本文…
-
在 Windows 中设置/安装/配置 FFmpeg 二进制文件,并使用 FFMPEG 和 Git Bash 转换视频格式
在本文中,我们将指导您使用 FFmpeg 和 Git Bash 将任何视频格式转换为 MJPEG 编解码器和 AVI 容器。无论您是视频爱好者、内容创作者,还是仅仅需要满足特定的视…
-
掌握 SIP 禁用:管理 VoIP 功能的最佳实践
有效的 VoIP 管理需要掌握 SIP 禁用技术,以确保通信的安全性和可靠性。SIP 或会话启动协议在通过 IP 网络启动、维护和终止语音呼叫方面发挥着至关重要的作用。 然而,配置…
-
CMC-Bench:视觉信号压缩的新范式
视觉信号压缩旨在最小化图像数据,在网络资源和存储容量有限的情况下,提高图像/视频的服务质量。自1991年以来,视觉信号的压缩率每十年增长一倍。然而,在即将到来的下一个十年,传统编解…
-
斩获 CVPR NTIRE 冠亚军,小红书如何提升短视频与直播体验质量?
近日,CVPR NTIRE 2024 Challenges[1] 各赛道相继公布比赛结果,小红书音视频架构团队图像算法组在两项重要竞赛中斩获冠、亚军。 其中,他们主导参与 Rest…
-
使用 Redis Pub/Sub、Golang 和 WebSocket 构建实时聊天应用程序
实时应用程序已成为现代网络开发的基石,可实现即时通信和交互。在本教程中,我们将使用 Golang、Redis Pub/Sub 和 WebSocket 构建一个实时聊天应用程序。在本…
-
在 Spring Boot 中实现 WebSocket 通信
WebSockets 是一种功能强大的技术,可实现客户端与服务器之间的实时双向通信。它们广泛应用于聊天系统、实时更新和在线游戏等应用中。Spring Boot 通过提供对 WebS…
-
有损视频压缩与无损视频压缩:有什么区别?
视频流媒体依靠先进的技术在全球范围内无缝传输内容。这项技术的一个重要方面是视频压缩,这是一种减小视频文件大小的方法。这一过程对于高效传输和存储至关重要,可确保视频在各种设备上快速加…
-
Android framework的GPU调频
AI时代已经来临,在日益增长的算力需求下,GPU已经成为AI世界不可或缺的工具,而移动端高渲染高帧应用也对移动端GPU提出越来越高的要求,本文将以高通的adreno gpu为例对G…
-
Smart Pointers:八年,SRS 内存泄露终于解决
本文转自“SRS开源服务器”官微。 8年后,我们使用自己实现的有限的简单Smart Pointers,解决了SRS的内存泄漏问题,保持项目的可维护性。 Introduction 每…
-
无需插件!在 WordPress 网页中 4 步实现直播功能
WordPress 是一个开源的内容管理系统(CMS),WordPress的灵活性和易用性使其成为个人博客、新闻网站、企业网站、电子商务网站等多种类型网站的理想选择。根据W3Tec…
-
抖音“BDVQAGroup”获得 DXOMARK 图像质量评估挑战赛全球第二 | CVPR 2024
近期,在计算机视觉领域最具影响力的「国际竞赛 CVPR 2024 NTIRE」中,抖音基础体验QA团队与AI 平台团队同学组成的“BDVQAGroup”小组,在 DXOMARK的图…
-
在 iOS 上使用 CallKit 和 WebRTC 掌握 Voip 音频
大家好!我叫 Kostya,是一名 iOS 开发人员。在过去的几个月里,我一直在使用以下协议栈开发点对点 (P2P) 通话功能: WebRTC、PushKit 和 CallKit。…
-
SRT:您需要了解的有关安全可靠传输协议的一切信息
很难相信,SRT 开源协议已经存在六年多了。为了纪念这一里程碑,我们编写了这篇全面指南,其中包含您需要了解的有关视频流协议的所有信息,该协议颠覆了世界视频流传输的方式。本文我们将探…
-
如何在 AWS ARM(Amazon Linux 2023 – Graviton)上安装 FFmpeg
如果您在 AWS 上进行多媒体处理,您可能会发现自己需要 FFmpeg 这个功能强大的多媒体框架。在本指南中,我将向您介绍在 AWS ARM 和 Amazon Linux 2023…
-
实时音频同步(第 2 部分)
多设备音频实时同步是一项引人入胜的挑战,它涉及解决延迟问题和确保播放事件的精确定时。在本系列中,我们将深入探讨此类系统的复杂技术。在第 1 部分中,我们讨论了实现精确定时以确保无缝…