按时间归档:2023年
-
VR 教育应用 Immerse 与英伟达合作推出网页版门户
近日,VR 语言学习平台 Immerse 宣布将与英伟达合作,成为其桌面流媒体功能的 VR 合作伙伴,为全球的语言学习者推出 VR-to-Desktop 流媒体。无需下载和安装…
-
ANGA COM 2023扩大了关于OTT、流媒体、连接和FTTH的国际会议计划
2023年4月17日,ANGA COM,2023年5月23日至25日在德国科隆举办的宽带、电视和在线展览及会议,今天发布了新的创新阶段的议程,可在此查阅。创新舞台是位于7号展厅的流…
-
Magine Pro 和 Appear 合作改造和优化 Sappa 的直播频道编码和分发工作流程
2023年4月17日,媒体处理和传输技术的全球领导者 Appear 和为 OTT 提供 B2B 管理服务的平台 Magine Pro 已被 Sappa 选中,将其 OTT 线性分发…
-
基于环路多帧预测的深度视频压缩 | TCSVT 2022
本文基于端到端深度视频压缩框架,提出了一种环路多帧预测模块(in-loop frame prediction module),在不额外消耗码率的情况下,对当前帧实现基于多个参考帧的…
-
音视频编解码–BMP格式
BMP图像是一种光栅图像(包含像素数据而不是矢量图像)格式。BMP图像的每个像素由单个位或一组位定义。自个人计算早期就已存在。它是一种无损格式,意味着保存图像时不会丢失任何信息。但…
-
网易伏羲荣膺双赛道三连冠!再创CVPR2023人脸表情竞赛四项佳绩
近日,IEEE/CVF计算机视觉国际顶级会议(CVPR 2023)公布第五届人脸表情国际挑战赛(ABAW5)的结果,网易伏羲AI实验室虚拟人团队再创佳绩:在人脸表情(肌肉)动作单元…
-
Bridge Technologies 为 VB440 增加杜比E监测功能
近日, Bridge Technologies 在使用 NAB 2023 展会上展示了他们的生产探头 VB440 带来的增强音频功能。特别需要关注的是增加的 D…
-
NPAW 在 NAB 2023 展会上推出新产品分析、SMB 解决方案
2023年4月16日,为在线视频企业提供分析和商业智能解决方案的领先供应商 NPAW 在拉斯维加斯举行的 2023 年 NAB 展会上推出了一系列新产品和新功能。这些新产品扩大了 …
-
VideoVerse 的 Magnifi 在2023年NAB展会上展示新的AI视频解决方案
人工智能驱动的视频技术公司和强大的视频编辑 SaaS 平台 VideoVerse 的 Magnifi 宣布将参加 4 月 16 日至 19 日在内华达州拉斯维加斯会议中心举行的 2…
-
高通加速Snapdragon Spaces在中国开发者生态的扩展
4月17日,高通技术公司宣布和北京神木科技有限公司(以下简称“神木科技”)展开合作。后者将在中国市场,为Snapdragon Spaces™ XR开发者平台这一跨终端平台和开放的合…
-
汇聚音视频新能量 探索行业新蓝海
视频行业卷成红海,如何突破瓶颈,去探索行业的新蓝海,本次LiveVideoStackCon 2022北京站邀请到快手高级副总裁、研发线负责人于冰,以《汇聚音视频新能量,探索行业新蓝…
-
计算机视觉2023年的三大趋势
我们中的许多人每天都与计算机视觉应用程序交互,从Apple的Face ID和Tesla Autopilot到Meta Quest和Google Lens。计算机视觉使机器能够像人类…
-
基于深度强化学习的拥塞控制 | PMLR 2019
本文提出并研究了深度强化学习 (RL) 的一个新的及时的应用领域:互联网拥塞控制。拥塞控制是调节流量源数据传输速率以有效利用网络容量的核心网络任务。随着网络直播、虚拟现实和万物互联…
-
图计算技术与标准化进展
近年来,随着互联网及移动互联网的发展,大量的数据从社交网络、在线服务、物联网应用等中产生出来。同时,随着传统行业向数字化转型,更多的数据也主动或者被动地被生产出来。传统上,数据在数…
-
RTP 时间戳的定义和应用
时间戳单位:时间戳计算的单位不是秒之类的单位,而是由采样频率所代替的单位,这样做的目的就是 为了是时间戳单位更为精准。比如说一个音频的采样频率为8000Hz,那么我们可以把时间戳单…
-
IM专题:分层架构IM系统(18)—系统消息逻辑实现
IM 消息中除了点对点的私信消息和群消息外,还有由 “系统” 发给用户的 “系统消息”。 系统消息通常包括两类:一类是由系统单独发给一个用户的私信系统消息,比如用户下单或支付后,系…
-
非约束环境下的轻量级实时多人三维动作捕捉
研究意义 基于多视角的多人三维姿态估计技术可以实现非接触式的多人三维动作捕捉,因而在影视动画、游戏、虚实互动和体育运动分析等领域存在广泛应用。基于该技术,我们可以通过若干个标定好的…
-
Transformer神经网络架构详解
Transformer是一种新型的深度前馈人工神经网络架构。在本文中,通过底层数学、python代码实现和不同层的可视化来解释了Transformer架构。
-
FFmpeg 解封装解码流程
先简单的了解一下FFmpeg 使用过程中需要用到的FFmpeg库、播放与解码流程、函数和相关的结构体。 FFmpeg 库简介 库 介绍 avcodec 音视频编解码核心库 avfo…
-
WHIP 和 WHEP 协议简介【WebRTC基础知识】
本文简单介绍了 WHIP 和 WHEP 协议的定义,作用和产生背景。方便大家了解 WebRTC 行业发展,以及处理 WebRTC 在发布者、媒体服务器和播放器之间关系。