技术文章
-
用 FFmpeg 释放 Rails 中的富媒体功能: 开发人员工具包
在不断发展的网络开发过程中,多媒体内容占据了核心地位。Ruby on Rails 开发人员经常面临将复杂的视频和音频处理功能集成到应用程序中的挑战。这时,功能强大的多媒体处理工具 …
-
DeepSVC:适用于机器和人类视觉的深度可扩展视频编码 | ACM MM 2023
本文主要讨论了端到端的视频编码方法,旨在同时满足机器视觉和人类视觉需求。本文提出了一种名为 DeepSVC 的深度可扩展视频编解码器,它支持从机器视觉到人类视觉的三层可扩展性。在编…
-
Flutter 中的 Socket 通信:构建实时应用程序
本文将探索使用 Flutter 强大的套接字编程功能构建实时应用程序的复杂性。揭开客户端之间无缝数据交换背后的秘密,并了解如何创建动态、响应式应用程序,以实现实时更新和同步体验。 …
-
将 HDR 视频引入 Reels 的技术挑战和优化实践
在过去一年中,Facebook 和 Instagram 的视频基础架构团队发现上传到我们应用程序的 HDR 内容数量大幅增加,每天都有数百万 HDR 视频上传。因此,我们一直在努力…
-
大饼 AI 变声怎么样?如何集成大饼 SDK 实现 AI 变声
大饼 AI 变声简介 大饼 AI 变声是市面上一款非常优秀的变声产品,是实时通话中的“柯南变声领结”,完美重现目标角色的音色与韵律,一键变声明星、游戏角色,同时保留用户的语速、情感…
-
如何在 Jitsi Meet 中启用转录功能
本文将介绍如何在 Jitsi Meet 中启用转录功能。 安装和配置 要通过转录安装和配置 Jitsi Meet,请执行以下操作: 1. 根据文档安装 Jitsi Meet。 2….
-
Meta 如何增强 WhatsApp 通话的安全性
隐私和安全是 WhatsApp 的核心。除了通过端到端加密保护个人消息外,WhatsApp 还赋予用户控制自己隐私设置的权力:从您分享的内容、您在网上的显示方式,到谁可以联系您或将…
-
RTMP直播协议深度解析:从保姆级入门到高级优化!
涉及到RTMP直播协议,了解其工作原理和优化技巧对于提升直播质量和用户体验至关重要。在这篇详细剖析的文章中,我们将深入探讨RTMP直播协议的各个方面,以及实际开发中遇到的一些情况,…
-
基于差分隐私的梯度稀疏赋能通信高效联邦学习系统设计与优化 | 南京理工大学李骏等
研究意义 联邦学习(Federated Learning)可在无需共享原始数据的情况下实现分布式客户端协作训练机器学习模型而得到广泛关注。然而,该架构中上传本地模型仍然有泄露客户端…
-
面向平台的智能客服系统之实践演进之路
一、前言 一直以来,面向运营使用的活动平台,在运营使用过程中会偶发出现一些疑难问题,比如运营对某个组件功能的使用有疑问,或者线上的活动表现不符合预期,运营期望产研协助排查。面对这些…
-
2024 年 WebRTC 趋势和预测
本文分享译自 bloggeek博客创始人 Tsahi Levent-Levi。以下是 2024 年的 WebRTC 趋势和预测。它们延续了我们在 2023 年看到的趋势,但也有一些…
-
音频文件格式–celt
CELT介绍 CELT 是一种开放、免版税的有损音频压缩格式,也是一种免费软件编解码器,具有特别低的算法延迟,适用于低延迟音频通信。这些算法是公开记录的,并且可以不受软件专利限制地…
-
WebRTC是什么?WebRTC技术原理详解
WebRTC(Web Real-Time Communication)是一种连接世界的革命性技术,它为通信和直播行业带来了巨大的提升。通过WebRTC,我们能够实现实时的音视频通信…
-
通过贝叶斯隐式表征来压缩数据 | NeurIPS 2023 Spotlight
论文摘要 在数字世界里,很多常见的数据类型都可以看作是一种特殊的连续函数形式,表征为隐式表征。例如,图像可以表征为将每个像素位置映射到对应RGB色值的连续函数。从这个角度出发,我们…
-
通过高斯-拉普拉斯-逻辑混合模型和串联残差模块学习的图像压缩 | TIP 2023
最近,基于深度学习的图像压缩方法取得了显着的成就,并在 PSNR 和 MS-SSIM 指标方面逐渐优于包括最新标准通用视频编码 (VVC) 在内的传统方法。学习图像压缩的两个关键组…
-
完整WebRTC相关协议规范思维导图,WebRTC学习路径
分享来自SIP实验室的《完整WebRTC相关协议规范思维导图》,作者james.zhu。 WebRTC技术发展迅猛,而且基于WebRTC的视频会议应用已经严重威胁到了商业视频会议的…
-
ffmpeg解封装流程
1、av_register_all() av_register_all() 是 FFmpeg 库中的一个函数,它已经在 FFmpeg 4.0 版本中被弃用。这个函数在旧版本的 FF…
-
用大语言模型合成正确的路由配置需要什么?
本文研究了大型语言模型(例如 GPT-4)是否能够在减少人工工作量的情况下合成正确的路由器配置。作者团队发现单独的 GPT-4 表现非常糟糕,它可以生成有一定可行性的粗略配置,但在…
-
IM专题:服务化架构IM系统(2)— 数据迁移
在 IM 服务化架构中,IM 的核心业务(比如:登录、收发消息、状态同步、未读数等等)的实现逻辑与在分层架构 IM 系统中实现逻辑高度类似;本质上,服务化架构就是分层架构,只是在垂…
-
RTMP 在直播场景的应用与动手实践
RTMP(Real Time Messaging Protocol)是一种设计用于实时数据通信的网络协议,主要用于在 Flash/AIR 平台和支持 RTMP 服务器之间流式传输音…