按时间归档:2023年07月
-
Vizrt 推出 Viz Channel Branding 新型自动化渠道品牌解决方案
2023年7月10日,为内容创作者提供实时图形和直播制作解决方案的领先企业Vizrt宣布推出Viz Channel Branding,为广播公司跨线性播放、FAST频道、VOD和O…
-
TAG 和 Skyline Dataminer加强集成,提高自动化、可视性和控制水平
日前,基于软件的 IP 端到端监控、深度探测和实时可视化解决方案的服务商 TAG Video Systems 宣布与Skyline Communications 的 Datamin…
-
深度学习在语音增强中的应用
随着科学技术的发展,语音作为新一代人机交互方式,成为人和智能设备、语音助手交流的重要接口,然而在真实环境中,语音信号不可避免的被各种噪声所干扰,除了各种环境噪声,声波在封闭空间中的…
-
在OpenCV中进行图像预处理
今天,我们进一步深入,并处理在图像处理中常用的形态学操作。形态学操作用于提取区域、边缘、形状等。 什么是形态学操作? 形态学操作是在二值图像上进行的。二值图像可能包含许多不完美之处…
-
相机APP 如何选择合适的分辨率?
影响相机画面效果的因素有很多,分辨率就是其中一个因素,1080p和720p的效果对比,画面清晰度等差别还是挺大的。 这篇文章主要分下面几点展开: 做camera效果tuning调试…
-
OpenGL ES 3.0 怎样将着色器程序二进制化
之前有位 VIP 读者提问:C++ 如何将 OpenGL ES 的着色器程序二进制(保存),然后在其他地方加载使用?现在写篇文章介绍下。 将着色器程序二进制化(Shader Pro…
-
音视频工具–Onvif设备管理器
ONVIF 设备管理器 (ODM) 是一款免费的开源软件实用程序,旨在管理符合 ONVIF 标准的网络视频设备,例如 IP 摄像机、视频编码器和网络录像机 (NVR)。ONVIF …
-
WebRTC NetEQ分析:架构和核心模块
1.NetEQ简介 NetEQ 本质上就是一个音频的 JitterBuffer(抖动缓冲器),全称是 Network Equalizer(网络均衡器), GIPS 语音引擎的两大核…
-
生成式人工智能如何重塑元宇宙的格局
人们对大流行期间捕捉到的元宇宙的可能性很感兴趣,因为人们正在寻找更有意义的方式来相互联系。然而,从那时起,元宇宙的热度有所下降。事实证明,吸引公众注意力的最新技术——生成人工智能,…
-
行业专家关于部署企业 XR 的五点见解
将XR引入工作场所本身就是一项挑战。然而,一旦公司拥有了一系列设备,下一步该怎么办? 无论公司规模大小,如何不仅在办公室中利用XR设备,而且确保参与、可扩展性和分销的成功? XR的…
-
是时候放弃聊天机器人了?
Gartner 关于这一主题的最新研究有一个令人沮丧的标题: “只有 8% 的客户在他们最近的客户服务互动中使用了聊天机器人”。那他们的情况如何呢?不太好。…
-
什么是联络中心人工智能?提示、好处和机会
联络中心人工智能对于今天几乎所有专注于客户体验的公司来说,可能是最令人兴奋的机会。多年来,公司一直在寻找方法,将他们的联络中心转变为一个更有利可图、更有成效和更有价值的资源。 人工…
-
什么是对话智能软件?对话智能软件终极指南
对话智能软件正在席卷联络中心。 我们生活在一个客户的声音和消费者数据对商业成功至关重要的世界中。随着客户体验世界的期望不断发展,公司必须收集尽可能多的洞察力,以确保他们能够竞争。 …
-
多模态算法在AIGC视频生成中的应用
随着抖音、快手、B站等视频平台的崛起,视频内容正占据着用户越来越多的时间。对于各个平台来说,内容视频化趋势明显。对于之家来说,也需要尽快完成在该赛道的技术工作。对于AIGC视频生成…
-
Hudl × 微帧科技,为美国运动分析平台提供极致视频编码服务
不久前,Hudl对外官宣了与微帧科技的合作,正式公布在其平台内融合微帧的WZ264及WZ265智能编码引擎,以提供更清晰的视频效果,帮助教练与运动员更精准分析比赛录像。 Hudl是…
-
音视频领域强大的辅助工具-ffmpeg常用操作介绍
前段时间老是有人问我,有没有其他格式的视频或音频提供,愿意有偿获取,如果其对ffmpeg比较熟悉,就不会那么麻烦。经常从事流媒体领域开发和研究工作的人,ffmpeg应该是我们最常用…
-
基于有意义学习的零样本语义分割方法 | 北航刘祥龙团队
研究意义 图像语义分割是计算机视觉中最重要的分支之一,被广泛应用于许多现实世界的场景中,如地理信息系统、自动驾驶、医学图像分析等。然而,传统的语义分割方法极大地依赖于像素级标注信息…
-
音视频通信及信令SIP协议压测方法浅析
网络基础设施升级、音视频传输技术迭代、WebRTC开源等因素,驱动音视频服务时延逐渐降低,使实时音视频(RTC)技术成为炙手可热的研究方向。实时音视频业务在消费互联网领域蓬勃发展,…
-
图像压缩对视觉识别的鲁棒性分析
目前,能够分析视觉数据而不仅仅是存储数据的最先进的识别模型无一例外地基于深度学习。尽管在降低推理成本方面做出了巨大的努力,但它们对内存和计算的要求很高。而图像压缩对于促进在设备上存…
-
增强x265开源HEVC视频编码器: 降低比特率和场景变化检测的新技术
由于对带宽的要求越来越高,特别是随着更高的设备分辨率的出现,对降低视频传输比特率而不影响视觉质量的需求也在增加。HEVC视频编码标准适合解决这一问题,它能以比其前身(H.264/A…