2023年3月29日,观止创想受邀参加在成都举办的第十届中国网络视听大会,作为大视频MIGU融合创新链的创始成员,与众多成员一起积极推动关键核心技术突破,助力大视频产业的蓬勃发展。
大视频MIGU融合创新链是由中国移动咪咕公司发起,是中国移动打造“移动信息现代产业链”至关重要的组成部分。整个链条具有跨领域、交叉学科融合、产业链条长的三大特点,旨在加快实现本土科技力量凝聚、独立自强,进行原创性、自主性、前瞻性的科技创新发展攻关,加强自主创新能力,通过深度探索,自主推动技术研发和产业升级。
在咪咕公司勇担数字经济、科技创新、新兴媒体的国家队、主力军责任和充分发挥“内容+科技+融合创新”优势的前提下,观止创想积极参与咪咕公司牵头的多个元宇宙、比特数智人项目,并在超高清编码及播出、AI画质分析、HDR vivid渲染、网络仿真测试等领域深度合作,为国内数字经济和实体经济建立高质量发展的融合创新生态;为网络强国、科技中国、数字中国贡献力量。
创新驱动发展战略大背景下,观止创想积极在视觉AI领域多方向发力,在电信运营商及广电传媒行业、互联网视频领域与元宇宙音视频方向持续投入研发资源。观止创想应用多模态、跨模态与向量检索技术,可由关键字智能生产剪辑视频,大幅提高用户剪辑视频的效率。
观止创想跨模态伏羲视频AI剪辑系统:
1)由图像特征提取器与线性分类器预测标签,完成图像与文字的对应匹配
2)从标签文本创建数据集分类器
3)跨模态预测
4)剪辑生成对应视频
英超第23轮:利物浦vs曼城 原始视频时长2小时53分,通过输入关键字“蓝队进球”一键生产剪辑视频。
源视频地址:https://v.qq.com/x/cover/mzc00200ewqg4au/t0036hlhl01.html
观止创想在AIGC领域将不同模态的数据进行融合,通过自适应处理和学习,将不同模态的信息相互转化和融合,从而实现跨模态数据的处理和应用。
具体来说,观止创想AIGC技术包含以下几个步骤:
1. 数据处理:从不同模态的数据源中提取数据,并进行预处理和特征提取。
2. 模态对齐:将不同模态的数据进行对齐,使得不同模态的数据具有相同的特征空间。
3. 跨模态编码:使用编码器对不同模态的数据进行编码,将其转换为统一的特征表示,从而实现模态之间的转换。
4. 跨模态解码:使用解码器将跨模态编码后的数据解码为原始数据,从而实现模态之间的转换。
5. 重建误差计算:通过计算重建误差,优化跨模态编码和解码的过程,提高跨模态数据处理的效率和准确性。
观止创想在AIGC领域可完成,文字生成故事、文字生成视频、文字生成图片等等能力,并且持续探索AIGC领域的无限可能。
同时观止创想在国产(云)虚拟化引擎、元宇宙数字人建模、音视频编转码、音视频超分修复、画质分析、网络测试等技术方面有长期的积累与实践。期望与大视频MIGU融合创新链上下游企业一起,聚集各方力量,跨学科、跨领域实现关键技术突破和融合创新,助力高质量移动信息现代产业链的加速成型。
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。