按时间归档:2023年
-
什么是音频中的动态余量?(录音、混音和母带制作)
动态余量是音频技术中的一个基本概念,在数字录音时代经常被忽视,尤其是对于初学者来说。了解音频的基础知识,包括动态余量的定义,将增强您的知识,并最终增强您处理音频时的技能。 什么是音…
-
LiveVideoStackCon 2023 深圳站开始征集讲师
7月31日,LiveVideoStack官微发布《时隔四年,当我们再次来到这里》,开始LiveVideoStackCon 2023 深圳站的讲师征集,以下为全文。 2019年,Li…
-
屏幕图像超分中的B样条纹理系数估计 | CVPR 2023
随着多媒体应用的快速发展,屏幕内容图像(SCI)已在人们日常生活中频繁出现。但是显示设备和SCI之间经常发生分辨率不匹配,并且,SCI有着边缘薄而锐利等特点,与自然图像很不同。然而…
-
苹果AR专利详细分享扫描对象以生成相应3D模型的解决方案
对于AR,扫描对象以生成相应的3D模型是一个重要的过程。所以在名为”Systems and methods for processing scanned objects“的专利申请…
-
即构科技:用AI赋能RTC,做有温度的实时互动
7月28日,即构科技应生态伙伴华为云的邀约,参加“华为云数字文娱Al创新峰会2023” ,现场与AI技术大咖、行业专家、企业前锋共同探讨Al新时代下,数字文娱产业的新未来。 即构科…
-
Opengl ES之颜色混合
关于混合,其实我们在之前的文章中也有使用到混合的功能了,例如在 Opengl ES之水印贴图 使用混合实现水印贴图。 什么是颜色混合? 颜色混合就是把两种颜色按某种规则混合起来得到…
-
网心科技:AI重新定义音视频生产力“新范式”
全球都沸腾在AIGC的风潮里,“边缘”为何会成为新内容形态的动能中心?面对海量的算力需求,如何构建未来就绪的算力基础架构?愈发清晰的“云—边”一体的AI算力格局,边缘云计算在其中又…
-
微帧科技成功入选中国信通院2023“铸基计划”高质量产品全景图
7月27日,由中国信通院主办的“2023数字生态发展大会”暨中国信通院“铸基计划”年中会议在北京召开。本次大会全面总结了“铸基计划”上半年度工作成果,并重磅发布了《高质量数字化转型…
-
面向大规模实时视频流的Overlay路由决策算法
实时通信(Real-Time Communication, RTC)是一类为用户提供实时的音视频通信服务的互联网应用,包括视频会议、网络电话、互动直播、云游戏、远程控制等形式,应用…
-
超低延迟开实体赛车、用算法解放G力上限?这个团队真的很大胆
Unity 不仅能应用在传统游戏开发领域,还可通过强大的 XR 渲染技术与超低延迟技术(RTE)相结合,带来突破虚实边界的新型娱乐体验。 “光子赛车”团队具有跨行业背景,从工业数字…
-
CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速
腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用 CV-CUDA™ 加速视频增强 AI 工作管线中的前后处理模块,结合 NVIDIA TensorRT™,将视频增强 A…
-
基于混合Transformer-CNN结构的学习图像压缩
大多数现有的学习图像压缩方法是基于 CNN 或基于 Transformer 的,它们具有不同的优势。如何有效的利用这两种方法的不同优势是一个值得探索的方向,而这面临着两个挑战:一是…
-
B站幻星数字人3D渲染技术揭秘
一 幻星数字人简介 幻星数字人是天工制作部联合人工智能平台部虚拟人算法组打造的3D数字人解决方案,主要由工业化数字人智能生成管线+AI驱动的表情与动作捕捉系统两部分构成。如上图所示…
-
2023 年购买数字孪生技术的 7 大理由
数字孪生技术在现代社会越来越受到关注。在元宇宙、工业 4.0 和不断发展的物联网兴起的时代,数字孪生变得越来越普遍。 一项研究发现,目前只有 5% 的受访者没有将数字孪生作为其转型…
-
Twilio 以预测性人工智能的名义与 AWS 合作
Twilio 扩展了与 AWS 的合作关系,以推进其预测性人工智能能力。 在纽约举行的 AWS 峰会上,Twilio 宣布扩大合作关系,增强 Twilio CustomerAI 的…
-
微软与谷歌的 CCaaS 争夺战
阿里大战弗雷泽、外星人对掠食者,马斯克对扎克伯格,没有哪一场竞争能与微软对谷歌相提并论。 当然,谷歌可能在网络浏览器和搜索引擎领域处于领先地位,但在企业领域,微软通常占据上风。 然…
-
使用 Spring Boot 的 WebRTC 信令服务器示例
在本文中,我将介绍如何构建一个用于 WebRTC 聊天应用程序的简单信令服务器。我还没有找到很多关于这个主题的文章,所以希望这篇文章能帮助你对 WebRTC 聊天应用程序中的信令操…
-
什么是MV-HEVC?MV-HEVC有什么新特性
什么是MV-HEVC? 针对3D视频、尤其是多视点拼接3D视频的新特性,JCT-3V标准专家组成立,并在2014年发表了适用于3D多视点视频编码的HEVC编码标准扩展:MV-HEV…
-
为可穿戴设备用户提供空间音频导航系统 | 苹果空间音频新专利
近日,美国专利商标局正式授予苹果一项与空间音频导航相关的专利,该专利将在未来的AirPods、智能眼镜和更轻量级的Vision Pro上使用。该系统通过双耳音频设备播放指向性音频,…
-
使用 Javascript、Python 和 WebRTC 构建远程桌面应用程序
本文分享使用 Javascript、Python 和 WebRTC 构建远程桌面应用程序。 要开发远程桌面应用程序,我们需要Electron,在“Electron”的帮助下,可以使…