按时间归档:2023年
-
Siamese SIREN:隐式神经表征的音频压缩 | ICML 2023 Workshop
隐式神经表征 (INRs) 已经成为一种很有前景的表示各种数据模式的方法,包括3D形状、图像和音频。虽然最近的研究已经证明了 INRs 在图像和 3D 形状压缩方面的成功应用,但它…
-
Cleanfeed 帮助 Forever Audio 为 Ivandoe 采集声音
音频后期制作公司 Forever Audio 充分利用 Cleanfeed 荣获艾美奖的远程录音软件,为卡通网络(Cartoon Network)的五章儿童电视系列动画片《英勇王子…
-
PipeWire 1.0 计划于今年晚些时候发布
用于 Linux 桌面的 PipeWire 音频和视频流解决方案计划于今年晚些时候发布其重要版本 “1.0”。 Red Hat 的 PipeWire 创始人…
-
2023 年 ICC 男子世界杯推出首个垂直视频直播以提升移动观看体验
2023 年 ICC 男子板球世界杯将在Disney Star的支持下通过 ICC TV推出新的垂直视频直播。新功能旨在改善本届板球世界杯期间的移动观看体验。 垂直直播涵盖了全部 …
-
IBC 2023 与会者热捧 PlayBox Neo 智能媒体多平台渠道管理
2023 年 9 月 25 日,广播质量媒体管理和播出解决方案服务商 PlayBox Neo 报告了 2023 年国际广播大会的成功举办,参加人数众多。该展会于 9 月 15 日至…
-
Amazon Prime Video 正准备于 2024 年在英国、美国和加拿大推出广告支持计划
亚马逊计划在 2024 年将广告纳入其Prime Video平台,为进一步的电视和电影制作提供资金。这一进展最初将影响英国、美国、德国和加拿大的 Prime 用户。 不…
-
消除联络中心的四大云迁移误区
云迁移已迅速成为客户体验行业的主流,并正在成为提高联络中心可扩展性和效率的关键成功因素。根据 Metrigy 的一份报告,在拥有联络中心平台的近 51% 的企业中,有 32% 的企…
-
活动 | 字节跳动多媒体实验室联合ISCAS 举办第三届神经网络视频编码竞赛
作为 IEEE 旗下电路与系统学会的旗舰国际学术会议, 2024年的ISCAS将于5月19日至5月22日在新加坡举行。本届 ISCAS 将继续联合字节跳动多媒体实验室,举办第三届神…
-
适用于下一代直播应用的实时 8K-60 FPS-HDR VVC/H.266 软件编码器 | IBC2023 技术论文
IBC2023: 本技术论文通过介绍实时 8K VVC 软件编码器,分析了 VVC 在直播应用中的功能。 摘要 VVC/H.266 是最新的视频编码标准,旨在显著提高 HEVC/H…
-
可控情感的表现力语音驱动面部动画合成
高度逼真的面部动画生成需求量很大,但目前仍然是一项具有挑战性的任务。现有的语音驱动面部动画方法可以产生令人满意的口部运动和嘴唇同步,但在表现力情感表达和情感控制的灵活性方面仍存在不…
-
sRGB就是BT.709吗?
sRGB就是BT.709吗?是的。 下图是维基百科上给出的常用颜色空间的CIE1931色域马蹄图,可以看到Rec709和sRGB色域是重合的。 BT.709也叫Rec.709,是I…
-
实时音视频技术在明星陪看直播中的应用实践
编者按:爱奇艺近年推出的明星陪看直播业务打造了明星真人与观众围绕影视剧综艺近距离实时互动的新体验,逐渐吸引了用户关注。而在技术落地方面,爱奇艺通过与第三方音视频服务供应商深度合作,…
-
如何使用 NGINX 设置 HLS 直播服务器
本文将介绍如何在 ubuntu 上设置自己的流媒体服务器。 1. 编译nginx带rtmp模块 首先,我们需要用 nginx-rtmp-module 编译nginx。 我们建议使用…
-
苹果设备是如何互相打招呼的——趣谈Bonjour协议
Labs 导读:使用苹果全家桶的同学们,肯定有过在多个设备之间无缝衔接的体验,比如隔空投送照片、文件,AirPlay电视投屏,还有自动共享热点密码,Apple Watch解锁Mac…
-
在流媒体应用中推流,拉流,转发,转码都是什么意思?
在视频流媒体相关的项目中,我们经常会听到推流,拉流,转发,转码这些名词,这些名词都代表什么意思呢?它们在流媒体项目中都有哪些意义?特别是目前的视频融合的项目越来越多,视频资源越来越…
-
使用生成式 AI 改善 VoIP 通信
随着生成式人工智能不断受到关注,其最吸引人的用例之一是它将如何与语音服务(例如 IP 语音)集成。基于人工智能的 VoIP 并不是什么新鲜事。多年来,该技术一直被用于为商务电话和呼…
-
如何在 Node.js 中流式传输音频和视频文件
要在 Node.js 中流式传输音频和视频文件,可以使用 http 和 fs 模块分别创建简单的 HTTP 服务器和从文件系统读取文件。您还可以使用 fluent-ffmpeg 库…
-
什么是 Slack AI?Slack AI 的演变和未来
2023 年 9 月,Salesforce(Slack 的母公司)宣布推出面向协作团队的全新 “Slack AI “工具包。与 “Slack 列…
-
Bolt:用于超低延迟的 Sub-RTT 拥塞控制 |nsdi23
数据中心网络倾向于将线路速率提高到 200Gbps 及以上,以满足 NVMe 和分布式 ML 等应用的性能要求。随着带宽延迟乘积 (BDP) 的增大,几个 BDP 内可以容纳越来越…
-
Blumenkrantz 优化 Mesa Vulkan 提交合并 – 部分测试用例改进 1000%+
Mike Blumenkrantz 是 Valve 星级 Linux 图形驱动团队的一员,他又完成了一项令人印象深刻的壮举,即进一步优化了 Mesa Vulkan 驱动程序代码,使…