技术文章
-
OTAvartar:具有可控三平面渲染交互的单样本说话脸化身 | CVPR 2023
本文提出了一种名为 OTAvatar 的方法,用于构建具有可控性、泛化性和高效性的人脸化身。OTAvatar 使用一种泛化可控的三平面渲染方案,从单个参考肖像构建个性化化身。它首先…
-
AVS感知无损压缩标准概述——视觉无损质量等级视频浅压缩
浅压缩又称夹层压缩,是一种视频压缩级别,可以有效降低视频带宽,并能保持视频整体质量,压缩比通常为2:1到8:1。根据这一压缩比,4K、8K节目都可以用10G接口进行传输,这极大降低…
-
AIoTel下视频编码(一)–移动看家视频水印溯源技术
Labs 导读:随着互联网和数字媒体的迅猛发展,视频内容的传播和分享变得非常普遍。然而,这也带来了一系列的版权侵权问题和内容来源不明的情况。为了解决这些问题,视频水印溯源技术应运而…
-
草图指导的文生图扩散模型
强大的文生图预训练模型缺乏可以指导合成图像的空间属性的控制方法。在这项工作引入了一种通用方法,通过在推理期间使用来自另一个域(例如草图)的空间图来指导预训练的文本到图像扩散模型。 …
-
Qt 前奏ALSA库的移植,录音和播放
ALSA库的移植和使用 1.ALSA简介 advance linux sound architecture –》高级linux声音架构,给程序员开发音频设备的驱动和应用…
-
边缘计算的一体化调度方案探索
Labs 导读:随着近些年VR、AR、物联网等技术的发展和推广,VR头显设备、物联网终端设备等瘦客户端的算力不足问题越发凸显,面对用户终端算力不足的问题,很多厂商都选择利用云计算来…
-
ffmpeg中YUV420 转NV12失败?
看到某篇文章描述了一个“bug”: 文章将其【错误的】解释为pixel_format设置没生效。 另一个常见的类似问题是: 伴随着的另一个问题是为什么(内置)aac编码器不支持S1…
-
如何在 Android 中使用 TLS 搭建 gRPC 客户端
对于客户端和服务器之间的交互,gRPC 是一个常见的概念。 什么是远程过程调用(RPC)? RPC 是一种软件通信协议。一个进程可以调用远程系统(如本地系统)上的一个过程(也称为函…
-
浅谈超高清现场制作场景中延时器的设计思路与研究
摘要:超高清现场制作延时器可以保障节目制作的完整性,对外来信号或整体视音频信号进行现场时移处置。本文基于广播级超高清现场制作演播室延时器的信号接口、信号处理、垫播内容、操作方式进行…
-
值得收藏的几个音视频小工具,全部开源免费
无论是在音视频项目的开发,测试还是实施过程中,都需要借助一些工具软件进行功能验证。好的工具软件可以极大的提高我们的效率。获得更好的验证结果,评估产品和项目的功能能力。 但是目前很多…
-
三分钟,带你了解下一代传输层协议QUIC
QUIC(Quick UDP Internet Connection,快速UDP网络连接)发音同 “quick”,是 Google 公司在 2012 年提出…
-
NNCodec: 神经网络编码 ISO/IEC 标准的开源软件实现 | ICML Workshop
本文介绍了神经网络编码 (NNC) 标准 (ISO/IEC 15938-17) 的第一个开源和符合标准的实现 NNCodec,并描述了其软件架构和主要编码工具。编码引擎的核心是上下…
-
基于多视图消息认证的鲁棒多智能体协作 | 南大袁雷、俞扬等
研究意义 多智能体强化学习近年来在多个领域取得快速发展及诸多傲人的成果,智能体通过与环境进行交互逐步优化,最终得到最优的策略。其中,多智能体协作凭借其在真实应用场景中的常见应用最近…
-
Qt中的摄像头显示,jpeg图片显示(jpeg库的移植和使用),Qt容器框架篇
QT中的容器 QT中的容器跟C++容器的用法几乎一模一样 1.对比 QT中的摄像头显示 1. 涉及到类 2. 思路和步骤 (1)获取当前系统中所有的摄像…
-
使用 Nest.js 和 Socket IO 的实时竞价引擎
“一次,两次,以这个价格成交”,是的,你没听错,我们说的就是竞拍。我们都在电影或现场拍卖中听说过,人们在拍卖中相互竞争,以赢得最终的头衔。一些平台正在为在线…
-
在Spring WebSocket中使用@SendTo和@SendToUser进行消息路由
在实时通信时代,WebSockets 已成为构建交互式低延迟网络应用程序的利器。Spring 框架一直提供简化开发过程的工具和注解,对 WebSockets 的支持也不例外。在 S…
-
使用信令服务器、ICE 和 STUN/TURN 构建 WebRTC Android 应用程序
WebRTC(Web实时通信)是一项功能强大的技术,可在Web和移动应用程序中实现实时音频和视频通信。在本文中,我们将使用 Java 创建 WebRTC Android 应用程序,…
-
社交直播多级缓存一致性解决方案-缓存管道
背景介绍 1. 2021年开始,社交直播活动中台因为需要支持的产品越来越多,优化过程中发现对于很多读场景来说中心缓存的读取已经成为了性能瓶颈,所以大量业务场景 开始采取二级缓存方案…
-
萤石开放平台JS SDK全新支持H.265解码
H.264作为视频画面最常用的编码格式,几乎所有播放器都支持该格式。近年来,视频应用需求高速增长,对视频编解码技术的能力要求也持续提升。升级版编码格式—H.265的出现,帮助开发者…
-
使用 SignalR 和 .NET MAUI 的实时聊天应用程序
实时应用程序的主要特点之一是能够向用户提供即时反馈。这类应用程序的例子包括消息应用程序、视频会议应用程序、协作编辑工具和实时数据仪表板。 聊天应用程序是实时应用程序中最受欢迎的例子…