按时间归档:2023年
-
2D人脸识别Camera图像采集
本文介绍2D人脸识别中的Camera图像采集部分,目前市面上Android阵营中大部分机型都使用的是2D人脸识别;图像采集主要是获取目标的RGB图像,2D人脸图像获取相对简单,只需…
-
什么是 NVLink?NVLink的历史和作用
NVLink 是加速系统中 GPU 和 CPU 处理器的高速互连技术,推动数据和计算加速得出可执行结果。 加速计算是一项曾经只有政府研究实验室中才有的高性能计算能力。如今,它已成为…
-
E-NeRV:时空信息解耦的视频隐式神经表达
内容摘要:最近,视频的图像隐含神经表示法 NeRV 因其有希望的结果和比常规像素隐含表示法迅速的速度而受到欢迎。然而,网络结构中的冗余参数会导致在扩展时出现较大的模型尺寸,以获得理…
-
在 Xcode 中将 OpenCV 集成到你的 Swift iOS 项目中并使用 UIImages
假设在你的 iOS 应用程序中,你想对图像执行抓取或使用特定插值调整图像大小,作为机器学习模型的预处理步骤。你无法在 Xcode 上使用 Apple 的原生框架(例如 Core I…
-
Caretta Research 公布广播和媒体(B&M)技术行业市场规模
广播和媒体技术供应商国际贸易协会IABM和分析研究公司Caretta Research首次公布了广播和媒体(B&M)技术市场的详细规模。 Caretta Research根…
-
苹果AR/VR专利申请多视图视频解码器
对于AR/VR,注视点成像主要基于图像内的感兴趣区域,亦即用户注视点来改变整个图像的图像分辨率,从而优化负载。然而,由于感兴趣区域在图像流内的位置会改变,所以必须并行解码具有不同注…
-
实时传输协议RTP简况及实现概述
RTP是由IETF的音频/视频传输工作组开发的,后来被国际电联作为其H.323系列建议的一部分而采用,并被其他各种标准组织采用。RTP的第一个版本是在1996年1月完成的,在完成之…
-
“音频ChatGPT” | 谷歌的AI音乐生成器
谷歌发布了一款先进的人工智能音乐生成器,可以将一段文本变成歌曲片段,但法律问题可能会阻止这家科技巨头与公众分享它。 人工智能革命:ChatGPT、DALL-E 2和其他能够根据用户…
-
音视频网络简介及RTP协议起源
使用包网络(如互联网)传输语音和视频的想法并不新鲜。分组网络上的语音实验可以追溯到20世纪70年代早期。关于这个主题的第一个RFC—网络语音协议-从1977年起。视频出现的较晚,但…
-
加速拥抱数字化,数字人助推金融行业高质量发展
当下,数字人技术日益深入社会,助力各行各业加速数字化转型。据《虚拟数字人深度产业报告》预示, 2022年上半年,我国虚拟数字人相关行业规模达750亿元,同比增长43.6%,并应用于…
-
如何使用 CPaaS 构建 WebRTC 应用程序(第一部分:原因)
在 “如何使用 CPaaS 构建 WebRTC 应用 “系列的第一部分中,我们将阐述 CPaaS 所扮演的角色,并对该过程进行概述。在后面的文章中,我们将看…
-
钉钉×Rokid发布「钉钉数字文化墙」,30分钟打造AR数字展厅
只需花30分钟,通过简单的拖、拉、拽,用户就能搭一个AR数字展厅?访客来了,掏出手机扫一扫码,就能体验?AI人机交互技术加持的文化墙搭建居然这么easy? 今日,Rokid创始人&…
-
高通宣布推出全新物联网解决方案以支持下一代物联网终端发展
为持续扩展物联网生态系统和用例,高通技术公司今日宣布推出全新物联网解决方案以支持下一代物联网终端发展:高通®QCS8550、高通®QCM8550、高通®QCS4490以及高通®QC…
-
AR 医疗设备公司 Ocutrx 收购电子制造和组装公司 Spectrum AMT
近日,AR 医疗设备公司 Ocutrx 宣布战略性收购电子制造和组装公司 Spectrum Advanced Manufacturing(Spectrum&nb…
-
AI 会改变视频压缩格局吗?
经过长达十年的努力,使用深度学习的完全神经视频压缩在正常情况下并未击败传统编解码器标准的最佳配置。使用 AI 来优化标准视频编解码器会改变这种格局吗?
-
Tethr 宣布推出 Tethr Live,一种新的实时对话分析解决方案
人工智能对话智能平台 Tethr 近日推出了 Tethr Live,这是一个实时对话分析解决方案,旨在帮助联络中心座席处理客户对话。该平台将提供 Tethr 平台对客户对话的洞察力…
-
Genesys 客户现在可以访问 Peerless Network 的高质量 SIP 中继服务
全球云通信供应商、现隶属于 Infobip 的 Peerless Network 近日宣布,其 SIP 中继服务现已在 Genesys 的 AppFoundry 市场上推出。Gen…
-
IMT-2030(6G)推进组发布《6G AI即服务(AIaaS)需求研究》报告[附PPT]
面向2030年及未来,6G将与先进计算、大数据、人工智能、区块链等信息技术交叉融合,实现通信与感知、计算、控制的深度耦合,推动5G三大典型场景,即增强型移动宽带(eMBB)、低时延…
-
FFmpeg 流媒体组成、媒体文件封装及传输协议
流媒体,从字面上理解就是像流一样的媒体,类比实际中就是类似水流、电流一样的概念。事实上,流媒体出现之前,网络上是不能播放电影,只能是通过下载文件到电脑上然后才可以观看,相信很多80…
-
Haivision2023广电转型报告中的五大行业趋势
Haivision每年都会进行行业现状调查,以了解广电行业的趋势和广电专业人士面临的挑战。今年,我们收到了迄今为止最多的调查回复,收集了全球700 多位广电专业人士的见解。这些受访…