MPEG 第 138 次会议进展

原标题:138th meeting of MPEG
原作者:Martin Benjak
原文链接:https://www.mpegstandards.org/138th-meeting-of-mpeg/
翻译整理:徐鋆

MPEG 系统组获得两项艾美奖

在 2022 年 4 月 26 日举行的第 73 届年度仪式上,美国国家电视艺术与科学学院(National Academy of Television Arts & Sciences, NATAS)授予 ISO/IEC MPEG 系统工作组(WG 3)两项技术与工程艾美奖,表彰其 MPEG-DASH 和开放字体格式标准。

自 1948 年以来,技术与工程艾美奖表彰电视相关技术的发展和创新,并表彰在该领域取得突破的公司、组织和个人。

今年,MPEG 系统组因其在“HTTP 封装协议的标准化”方面的工作而获得了技术与工程艾美奖。在这一类别中获得艾美奖的还有 3GPP、苹果和 MLB Advanced Media。

MPEG 系统在 2009 年开始了关于 HTTP 流的项目。2012 年,MPEG 发布了第一版 HTTP 动态自适应流媒体(Dynamic Adaptive Streaming over HTTP, DASH)标准(ISO/IEC 23009),此后又发布了三版。第 5 版 MPEG-DASH 标准预计将于 2022 年发布。

MPEG-DASH 标准定义了一种传输格式,用于在使用 CDN 的可变带宽的网络上以最高质量传输多媒体内容。它的功能支持许多服务和应用,如点播视频、实时直播流、低延迟流和目标广告插入。MPEG-DASH 是第一个真正开放的互联网视频流国际标准,实现了多厂商互操作的解决方案,并已被业界和各种联盟广泛采用。

该标准是在世界各地的专家的大力参与下制定的。来自 60 多家公司的 90 多位专家参与了十多年来该标准所定义的最先进技术的开发工作。特别是以下专家,他们以各种方式为标准的制定做出了贡献,得到了 MPEG 的认可:Ali C. Begen, Romain Bouqueau, Imed Bouzazi, Zachary Cava, Mary-Luc Champel, Cyril Concolato, Igor Curcio, Franck Denoual, Mike Dolan, Wang Fang Gerard Fernando, Per Fröjdh, Alexander Giladi, Jeff Goldberg, Miska Hannuksela, Mitsuhiro Hirabayashi, Paul Higgs, Ingo Hoffmann, Kilroy Hughes, Will Law, Jin Young Lee, Jean Le Feuvre, Brendan Long, Sylvain Kervadec, Yongliang Liu, Brenden Long, Shivakumar Mahadevappa, Frederic Maze, Nhut Nguyen, Harry Pile(已故), Yuriy Reznik, Sungryeul Rhyu, Yago Sanchez, Thomas Schierl, Iraj Sodagar, Thomas Stockhammer, Kevin Streeter, Yasser Syed, Viswanathan (Vishy) Swaminathan, Emmanuel Thomas, Christian Timmerer, Ye Xiaoyang, Ye-Kui Wang, Mark Watson, Yang Yanzi, Shaobo Zhang, 和 Waqar Zia。许多公司和机构参与其中,为 DASH 标准的制定提供专家和资源,包括 Adobe、Akamai、Bitmovin、Brightcove、字节跳动、CableLabs、Canon、Cisco、Comcast、Ericsson、ETRI、Fraunhofer、谷歌、华为、Hulu、InterDigital Communications、LG 电子、KPN、微软、Netflix、Orange、诺基亚、Ozyegin 大学、松下、高通、三星、索尼、巴黎电信、腾讯美国、小米、Klagenfurt 大学、Vubiquity 和中兴。

MPEG-DASH 小组主席 Iraj Sodagar 说:“DASH 标准的成功表明,当整个行业参与到 ISO/IEC JTC 1 等知名 SDO 下的标准化项目时,所产生的标准可以通过实现生态系统不同部分之间的互操作性而对整个行业产生直接影响。”

今年颁发给 MPEG 系统的第二个技术与工程艾美奖是用于开发 ISO/IEC 14496-22 “开放字体格式”,其第四版已于 2019 年出版,目前正在为第五版开展工作。艾美奖是因“用于网络和电视设备的定制可下载字体和排版的字体技术标准化”而颁发的,W3C 也被授予了该类别的艾美奖。

作为 MPEG-4 系列标准的一部分,字体技术标准化工作于 2004 年随着 ISO/IEC 14496-18 “字体压缩和流”的发布而启动。这项工作随着新的第 22 部分(ISO/IEC 14496-22)“开放字体格式”的发展而继续进行,该部分是基于 2004 年微软和 Adobe 对 OpenType 技术的贡献。自那时起,该标准已被多次修订和扩展,并有一个广泛的专家群体参与其中,他们提供了排版学、语言学、字体设计和计算机科学方面的综合专业知识。为这项工作做出贡献的专家包括一些大公司的代表,包括 Adobe、苹果、谷歌、微软、Monotype,以及许多个人贡献者和主题专家,包括 John Hudson、Laurence Penney 和 Adam Twardoch(以及其他许多人)都做出了宝贵的贡献。Vladimir Levantovsky(Type Standards LLC)曾担任字体分组的主席和两个标准的项目编辑。

字体分组主席 Vladimir Levantovsky 说:“字体是任何书面交流的关键组成部分。文字承载着一种意义,但正是字体使文字具有可读性–字体使书面文字具有声音!。ISO/IEC JTC 1 的 MPEG 系统工作组(SC 29/WG 3)对开放字体格式技术的标准化极大地影响了所有类别的消费电子设备的能力,为数字电视、流媒体环境和网络带来了先进的字体技术。它还激发了许多开源项目,使高质量的字体渲染和先进的文本支持得以大规模采用,使 OEM、服务提供商和内容作者能够轻松和经济地部署支持世界上所有语言和书写系统的新功能和应用程序。”

图片
WG3 的专家们因为为网络和电视设备定制下载字体和排版的字体技术标准化而获得了艾美奖
图片
MPEG 因 HTTP 封装协议的标准化而获得艾美奖

MPEG 为“基于 MPEG-I 视频的动态网格压缩”挑选技术

此前,MPEG 在 2021 年 10 月发布了动态网格压缩(dynamic mesh compression)技术的提案征集(CfP)。在第 138 次 MPEG 会议上,MPEG 3D 图形编码组(WG 7)审查了提交给该 CfP 的材料,并为随后的标准化过程选择了技术。根据(i)几何学和属性的客观测量和(ii)在两个测试点进行的主观可视化测试,对涵盖完整编解码器的五份提交材料进行了评估。

在 CfP 中选择的技术已经能够有效地表现真实的动态物体(包括人类),MPEG 3D 图形编码组将进行额外的实验,以进一步改进这一基础技术,并为完整的编解码器(编码器和解码器)制作标准规范文件和测试模型。最终的标准将使在游戏和 VR 或 AR 体验中包含逼真的 3D 动态物体成为可能,在虚拟世界之间传输,并为艺术表演和体育赛事创造沉浸式体验。

预计该标准将在 2023 年 4 月进入其审批过程的第一个正式阶段,即委员会草案(CD),然后是 2024 年 1 月的国际标准草案(DIS)和 2024 年 10 月完成的国际标准(IS)。

MPEG 为“编码器和打包器的同步和资产存储”挑选技术

在 2022 年 1 月的第 137 次 MPEG 会议上,MPEG 技术需求组(WG 2)发布了关于编码器和打包器同步和资产存储技术的提案征集(CfP)。在第 138 次会议上,MPEG 完成了对 CfP 响应的评估。CfP 的答复满足并补充了 CfP 的要求,其中一项建议涉及编码器/打包器同步,另一项建议涉及资产存储和记录。这些答复的组合已经涵盖了 85% 的表示同步要求和 75% 的存储要求。此外,这些建议与现有的 MPEG 规范,特别是 MPEG-DASH 和 CMAF 非常吻合。因此,MPEG 在本次会议上为即将出台的规范制定了一份工作草案文本。最终的标准预计将在 2023 年初完成。

该标准将极大地帮助行业实现 24×7 直播内容的生产和存储的有效互操作性。它满足了基于云的工作流程中 24×7 直播媒体制作和分发的具体要求,如使用基于对象的云存储。该提案解决了冗余编码器同步的故障处理、(多编解码器)码率阶梯的分布式编码和 A/B 水印等用例。由于这些建议是基于 MPEG-DASH 和 CMAF,本标准还介绍了将这些 MPEG 技术用于广播公司和内容所有者所针对的关键用例的最佳实践。

MPEG 技术需求工作组感谢那些对 CfP 提交答复的提议者。MPEG 将继续收集和征求反馈意见,以便在即将举行的会议上改进该解决方案。

MPEG 完成了对 EVC 和 VVC 的 CMAF 支持

作为将最近开发的视频编码标准整合到存储和传输标准的努力的一部分,在第 138 次 MPEG 会议上,MPEG 系统组(WG 3)完成了通用媒体应用格式(Common Media Application Format, CMAF)对通用视频编码(Versatile Video Coding, VVC)和基本视频编码(Essential Video Coding, EVC)作为负载的标准化过程。

用于片段式媒体的 ISO/IEC 23000-19 通用媒体应用格式(CMAF)第三版已达到标准制定的最后里程碑,即支持这些新视频编码技术的国际标准最终草案(FDIS)。该规范为 VVC 和 EVC 定义了 CMAF 轨道和媒体配置文件。对于这两种视频编解码器,规定了在 CMAF 中使用的基本流的限制和对参数集某些字段的允许值的限制。此外,还规定了对补充增强信息(Supplemental Enhancement Information, SEI)和视频可用性信息(Video Usability Information, VUI)的使用限制。本规范还定义了指示视频编解码器一致性点的方法,如配置文件、级别、工具集指示等。关于 VVC,该规范支持单层和多层比特流的传输。

由于 CMAF 已经被其他标准开发组织(Standards Development Organizations, SDO)采用,而且许多组织一直期待将新的视频编解码器整合到 CMAF 中,并提出各种应用要求和限制,在开发过程中与他们积极合作。通过联络沟通和公开的 GitHub 讨论,我们收到了许多宝贵的意见,仔细研究,并尽可能地反映出来。

MPEG 发布对“机器视频编码”的提案征集

在第 138 次 MPEG 会议上,MPEG 技术需求组(WG 2)发布了一项提案征集活动(CfP),征集能够为机器视觉任务进行高效视频编码的技术和解决方案。

这项关于“机器视频编码”的工作旨在为机器任务压缩输入视频和图像或特征图。由于机器使用和理解视觉数据的方式与人类视觉不同,编码技术和解决方案可以与传统的不同,即使是视频和图像的编码,以实现机器使用的优化性能。随着机器学习技术和机器视觉应用的兴起,机器所消耗的视频和图像数量一直在迅速增长。典型的用例包括智能交通、智能城市、智能内容管理等,这些都包含了机器视觉任务,如物体检测、实例分割和物体跟踪。由于大量的视频数据,为了有效地传输和存储,必须对视频进行压缩。除了高度要求的压缩优势外,VCM 还可以在其他方面有所帮助,如计算卸载和隐私保护。

在过去的三年里,MPEG 研究了机器视觉任务中有效压缩视觉数据的潜在技术,并建立了一个评估机制,包括通用测试条件(common test conditions, CTC)、基于速率失真度量的指标和评估管道。除了现有的图像数据集,一些新的数据集,特别是视频数据集,已经被建立并捐赠给 MPEG,这对未来的研究和标准化很有价值。

这个 CfP 欢迎公司和其他组织提交建议。要求在 2022 年 7 月 6 日前注册;在 2022 年 9 月 30 日前提交比特流文件、成果和解码器;在 2022 年 10 月 12 日前提交建议者文件。2022 年 10 月的第 140 次 MPEG 会议将对响应 CfP 的提交文件进行评估。

请已经开发了 VCM 技术的公司和组织通过联系 MPEG 技术要求召集人 Igor Curcio 博士(igor.curcio@nokia.com),将这些信息作为对该 CfP 的回应。

MPEG 白皮书:媒体智能合约

在第 138 次 MPEG 会议上,MPEG 联络和通信组(AG 03)批准了一份关于 MPEG 媒体智能合约的白皮书。

在过去几年中,MPEG 开发了一套标准化的 RDF 本体和 XML 模式,用于编纂与音乐和媒体有关的知识产权(IP)信息。ISO/IEC 21000-19 媒体价值链本体(Media Value Chain Ontology, MVCO)通过捕捉用户角色及其对特定 IP 实体的允许行为,为公平、及时和透明的交易促进权利跟踪。ISO/IEC 21000-19/AMD1 音频价值链本体(Audio Value Chain Ontology, AVCO)扩展了 MVCO 与描述音频领域的 IP 实体有关的功能,例如,多轨音频和时间段。ISO/IEC 21000-21(第二版)媒体合约本体(Media Contract Ontology, MCO)促进了叙述性合约向与 IP 权利的利用、支付和通知有关的数字合约的转换。关于后者,XML 模式已被开发为 ISO/IEC 21000-20(第二版)合约表达语言(Contract Expression Language, CEL)。

此外,这些 XML 模式和 RDF 本体中的准则可以推动在受控环境中执行与权利有关的工作流程,例如分布式账本技术(Distributed Ledger Technologies, DLT),其中透明度和互操作性有利于实现音乐和媒体的公平贸易。因此,ISO/IEC 21000-23 媒体智能合约的目的是提供将这些 XML 和 RDF 媒体合约转换为可在现有 DLT 环境中执行的智能合约的方法(例如,应用编程接口)。通过对几种智能合约语言以标准方式进行这种转换,MPEG-21 CEL/MCO 模式和本体将作为跨语言,将经过验证的合约数据从一个 DLT 转移到另一个 DLT。

这个标准的另一个重要特点是,它提供了将智能合约的条款与叙述式合约的条款绑定的可能性,反之亦然。通过这种方式,签署智能合约的每一方都清楚地知道存储在智能合约中的条款是什么。

第 138 次会议发布的标准文档见:https://www.mpegstandards.org/meetings/mpeg-138/

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论