技术文章
-
人工智能与视频处理和编码
人工智能(AI)是一项令人兴奋的新兴科技技术。每天都会有让人耳目一新的人工智能应用推出来改进和便利人类的生活,可以说,人工智能正在以迅雷不及掩耳之势重塑着人们的生活方式。 对于未来…
-
“活”起来才能“火”起来,博物馆如何借势虚拟人技术?
近年来,数字孪生、超高清、多传感器融合、AR、VR等新体验技术飞速发展,为博物馆数字化运营奠定了技术基础。 在实体博物馆中引入数字技术,拓展了文化的时空边界,丰富了博物馆自身的功能…
-
Opengl ES之矩阵变换(下)
在上一节 《Opengl ES之矩阵变换(上)》 中,我们通过矩阵变换实现一个一些形变的效果。 如果细心的童鞋们可能会发现,我们的运行结果渲染的图片宽高明显是有些变形了,特别是在手…
-
今天,我想去一个平行世界
2023的开年爆款,非《流浪地球2》莫属。 它展开了人类的新话题,关于平行空间,关于数字生命,关于人类文明。跟随这部科幻巨作,穿越平行空间,领略前所未有的真实视觉震撼;认知数字意识…
-
IEEE SLT 2022论文丨如何利用x-vectors提升语音鉴伪系统性能?
分享一篇IEEE SLT 2022收录的声纹识别方向的论文,《HOW TO BOOST ANTI-SPOOFING WITH X-VECTORS》由AuroraLab(极光实验室)…
-
如何在H264码流的SPS中获取宽和高信息?
前言 了解H264视频编码格式的小伙伴都知道,H264编码中存在两个非常重要的参数集。没错,它们就是序列参数集(SPS)和图像参数集(PPS),而且通常情况下,PPS会依赖SPS中…
-
用于空间音频的虚拟听觉空间 | 苹果专利
近日,美国专利商标局正式公布了苹果公司新授予的55项专利,涵盖AirPods(第三代)的设计和实用专利,以及两项空间音频专利。 其中,根据Apple的说法,空间音频创建了一个3D虚…
-
类似”QQ小窝”的虚拟小窝怎么实现?
在前面的文章 什么是虚拟小窝?即构虚拟小窝方案介绍 我们给大家简单介绍虚拟小窝方案、应用场景等。玩过QQ小窝的应该对里面的个人形象、个性的房屋装扮以及逛小窝都很熟悉,那它们是怎么实…
-
OpenSIPS 3.3 在IP多媒体子系统和统一通信环境中传递消息
OpenSIPS 最新的 3.3 版本引入了几个新模块,这些模块有助于在 IMS 和 UC 环境中实现消息传递服务。本次演讲介绍了 OpenSIPS 中新的 MSRP 堆栈、MSR…
-
一种具有破纪录能效的数据传输解码器芯片
想象一下,使用网上银行应用程序将钱存入你的账户。像所有通过互联网发送的信息一样,这些通信可能会被噪声破坏,噪声会在数据中插入错误。 为了克服这个问题,发送方在传输数据之前对数据进行…
-
WebRTC 中的媒体流轨道简介
WebRTC 媒体轨道使用 MediaStreamTrack 接口管理。MediaStreamTrack 接口通常表示音频或视频数据流,并且 MediaStream 可能包含零个或…
-
ICLR 2023|DiffEdit:基于 Diffusion 的语义图像编辑
在本篇文章中,作者提出了 DiffEdit,一种用以文本为条件的扩散模型进行语义图像编辑的方法。语义图像编辑是图像生成的延伸,其额外的约束条件是生成的图像应尽可能地与给定的输入图像…
-
AWS 上的高可用 WebRTC 媒体服务器
为大中型使用管理WebRTC 媒体服务器的最佳方法之一是使用基于云的按需扩展。Amazon Web Services (AWS) 提供了一些可以帮助您扩展基础设施需求的最佳工具。 …
-
什么是 RTMP协议?RTMP 流媒体的工作原理和优势
实时消息协议 (RTMP) 是一种流行的视频流协议。Adobe Systems在 1990 年代后期取得成功,并广泛用于实时流媒体和视频点播 (VOD)。RTMP 是一个二进制协议…
-
美摄科技:手把手教你打造专属数字人
伴随ChatGPT的问世,在技术与商业运作上都日渐发展成熟的数字人产业正持续升温。去年9月,北京市发布了国内首个数字人产业专项支持政策,提出将依托国家文化专网将数字人纳入文化数据服…
-
3D成像技术介绍
编者按:随着时代的发展,内容传播的形式在不断演进,而从2维升级到3维,是科技发展之必然。在未来几年,3D影像技术将加速全面向市场渗透。LiveVideoStack邀请到了螳螂慧视的…
-
收声设备简介
本文分享来自“抖音多媒体评测实验室” 撰写的收声设备介绍。将从麦克风、话筒等方面为大家带来一些关于发声设备的知识,欢迎关注了解。 1 麦克风单体及选型 1.1 麦克风单体 MIC:…
-
发声设备简介
本期将从以下几个方面为大家带来一些关于发声设备的介绍,下一期还有收声设备相关介绍,欢迎关注了解。 SPK单体及选型 1、SPK单体 SPK:Speaker、扬声器或喇叭 动圈式扬声…
-
什么是云导播?云导播技术综述
1. 什么是云导播台 近年来,大量线下和传统的业务搬到线上,使得云上业务呈爆发式增长,其中也包括了云导播台。 那么什么是云导播台,云导播台有什么功能呢?先说说什么是传统导…
-
YUV是什么?YUV采样和格式图解
YUV指的是亮度参量和色度参量分开表示的像素格式,其中Y表示的是亮度(Luma),也叫灰度;而”U”、”V”表的是色度。”…