按时间归档:2023年
-
WebRTC MediaDevices API 获取媒体设备的访问权限(webrtc入门二)
本文将介绍 MediaDevices API,如何获取用户的媒体设备(摄像头和麦克风)以及如何获取特定的视频分辨率等。 这部分是上一篇文章《使用 JavaScript 和 Node…
-
落地音视频服务 开启非接触金融服务运营新模式
近年来,在社会大环境和银行数字化转型催化“非接触金融服务”背景下,远程银行纷纷加快数字化转型步伐。在充分发挥远程银行渠道和专业优势基础上,科技赋能与智慧运营成为远程银行抢占转型风口…
-
Gartner视角下,边缘云是新兴技术的影响雷达
最近,我们在谈视频化狂飙、谈AIGC颠覆、谈算力动能不足,很少谈及边缘。但“边缘”恰恰与这一切相关,且越发密不可分,它是未来技术发展的极大影响因子。 “到2025年,超过70%的组…
-
FFmpeg 入门学习 09–音视频解码公共接口实现
使用 FFmpeg 进行音视频解码,其实是一套标准操作,按照固定的流程进行实现即可。使用 FFmpeg 进行音视频解码的基本流程、及用到的关键 API 接口和 结构体,如下图所示:…
-
高通骁龙Spaces XR SDK带来空间映射和网格划分功能
骁龙SpacesXR开发者平台是一个支持OpenXR的AR基础平台,支持一系列领先的3D引擎,如Epic Games的Unreal,Niantic的Lightship开发者平台,以…
-
WebRTC动态:M113 中支持 VP9/AV1 联播
近日,在 WebRTC 讨论组中,开发人员 Henrik Boström 表示可以通过指定 scalabilityMode 和 scaleResolutionDownBy 来选择加…
-
融合新技术打造运营商“慢直播+”创新应用模式
2020年初,央视频的《疫情24小时》以慢直播的形式展现火神山和雷神山医院的建设过程,慢直播业态在国内成为现象级的议题。近年来通信运营商将“慢直播”作为视频监控的创新型业务大力发展…
-
WebRTC 实战: P2P 架构的多人音视频通话解决方案
随着互联网技术的飞速发展,实时音视频通话已经成为在线教育、远程办公、社交媒体、云游戏等领域的核心功能。WebRTC(Web Real-Time Communication)作为一项…
-
Qplayer2播放器——用扩展性支撑起未来需求
随着手机性能的不断升级,人们对于播放器的需求也在爆发式增长。对此,LiveVideoStackCon 2022 北京站大会邀请到了来自七牛云的资深开发工程师、播放器负责人,陈军奇老…
-
H.264 码流结构和编解码过程
了解 H.264 的码流结构,以及这样设计的原因,编解码的过程就有了具体的依托。实际上 H.264 规范也是先规定了码流结构,再规定解码器的结构(对于编码器的结构和实现模式没有具体…
-
辛亮博士:5G算网赋能车联网落地
近日,第六届全球边缘计算大会在北京成功召开,本次大会由边缘计算社区主办,并得到了EMQ、火山引擎、联想集团、天翼云、SmartX等企业的联合支持。产、学、研、用各界专家跨界交流,共…
-
AI模型技术国家标准正式发布 全球标准体系布局基本成型
2023年3月17日,由北京大学、鹏城实验室、华为、百度等16家单位共同编制的国家标准《信息技术 神经网络表示与模型压缩 第一部分:卷积神经网络》(GB/T 42382.1-202…
-
基于多任务学习的保留背景音的语音转换 | ICASSP2023
在影视、有声书内容中,背景音是一种表现丰富的艺术形式。语音转换(Voice Conversion)如能将源说话人语音转换成目标说话人语音的同时,保留源语音中的背景音,将会提供更沉浸…
-
如何处理计算机视觉和深度学习中的图像数据
在过去几年从事多个计算机视觉和深度学习项目之后,我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时,甚至可能不需要深度学习…
-
什么是LUT滤镜?如何在Opengl中使用LUT滤镜
什么是LUT滤镜 从今天开始我们开始进入Opengl ES的滤镜专题,提到滤镜就不得不提用得最多的LUT滤镜了。 LUT全称LookUpTable,也称为颜色查找表,它代表的是一种…
-
复活RTMP:和OBS支持RTMP HEVC新标准
OBS 29.1支持RTMP的HEVC,所以你现在可以用OBS和SRS做HEVC的直播了。 现在,RTMP支持HEVC出新标准了,详见Enhanced RTMP。这个标准定义了一个…
-
低延时音视频技术在OPPO云渲染场景的应用
本文主题是低延时音视频技术在 OPPO 云渲染场景的应用与实践。 主要包括以下内容: 1. 云渲染场景的传输需求及挑战 2. RTC 和云渲染业务的结合 3. 低延时串流技术探索 …
-
智能眼镜可识别无声语言指令
一款名为EchoSpeech的低功耗可穿戴设备只需要几分钟的用户训练数据,就可以识别命令,并在智能手机上运行。 信息科学博士生Ruidong Zhang是“EchoSpeech: …
-
使用 JavaScript 和 Nodejs 搭建 webrtc信令服务器(webrtc入门一)
由于 WebRTC 入门学习的信息比较杂乱,我决定创建一个教程。希望它对任何想尝试 WebRTC 的人都有帮助。 虽然 WebRTC 不是一项新技术,但它在不断发展。WebRTC …
-
即构科技获“最受欢迎虚拟人AI引擎提供商奖”,ZEGO Avatar商业化落地价值广受市场认可
近日,由全球新经济产业第三方数据挖掘和分析机构艾媒咨询主办的“2023年中国虚拟人产业大会暨AIGC创新发展论坛”在广州召开。数百名行业精英领袖、资深分析师、虚拟人项目主理人、高校…