视频技术的文章 - 实时互动网个人中心 - 实时互动网

视频技术认证作者

记录视频技术开发相关内容

258 文章

0 评论

4 粉丝

技术文章

用于多视角视频压缩的显隐混合表达

内容摘要：随着3D显示和虚拟现实的日益普及，多视角视频成为一种极具前景的格式。然而，其高分辨率和多相机拍摄导致数据量大幅增加，使得存储和传输成为一项具有挑战性的任务。为了解决这些…

视频技术
2025年2月13日
技术文章

ControlVideo：单镜头文本驱动的视频编辑 | 清华大学朱军团队

研究意义文本驱动的视频编辑要求编辑后的视频应忠实地保留源视频的内容，各帧之间保持时间一致性，并且与目标文本以及 (optional) 参考图像对齐。然而，同时满足这三个要求存在很…

视频技术
2025年2月12日
技术文章

发展和提升：标准在向更多受众推广沉浸式视频中的作用

InterDigital 视频实验室元视频组主任兼负责人 Philippe Guillotel 评论了标准在为触觉技术和沉浸式视频提供基础方面的关键性。随着我们的沟通和娱乐模式不…

视频技术
2025年1月13日
技术文章

利用 AI 模型提高视频流中手语的无障碍性

流媒体能够连接不同的观众，但让所有人都能观看视频内容仍然是一项挑战。无障碍必须成为优先事项，尤其是对于面临独特障碍的聋哑和听力障碍观众。虽然传统字幕（音频和视频）对某些人有帮助，但…

视频技术
2025年1月3日
技术文章

什么是 NVOD？VOD 和 NVOD 有什么区别

视频流媒体改变了我们如今观看喜爱内容的方式。目前，大部分家庭至少拥有一项订阅式流媒体服务。这一转变创造了提供电视节目服务的新方式。视频点播 (VOD) 让观众可以随心选择观看内容…

视频技术
2025年1月3日
技术文章

设计类 YouTube 应用：深入了解视频流架构

YouTube 已成为视频共享和流媒体的代名词。无论你是想掌握食谱、学习编码，还是观看苹果公司发布最新的技术创新，YouTube 都能满足你的需求。很难想象没有这个平台的日子，它已…

视频技术
2025年1月2日
技术文章

CoordTok：可扩展的视频标记器，可学习从基于坐标的表示到输入视频的相应块的映射

将视频分解成视觉模型所需的更小、更有意义的部分仍然颇具挑战性，特别是长视频。视觉模型依靠这些较小的部分（称为标记）来处理和理解视频数据，但高效地创建这些标记却十分困难。虽然近期的工…

视频技术
2024年12月26日
技术文章

视频质量评估 | 全面综述

视频质量评估（Video Quality Assessment, VQA）旨在以高度符合人类感知的方式预测视频质量。然而，传统基于自然图像或视频统计特性的VQA模型在面对用户生成…

视频技术
2024年12月19日
技术文章

Meta AI 发布 Apollo：用于视频理解的全新 Video-LMM 大型多模态模型系列

虽然多模态模型 (LMM) 在文本和图像任务方面取得了显著进展，但基于视频的模型仍然不够完善。视频本质上很复杂，结合了空间和时间维度，需要更多的计算资源。现有方法通常直接采用基于图…

视频技术
2024年12月18日
技术文章

基于逐帧和逐段时空交互记忆网络的高效视频目标分割 | 党吉圣,郑慧诚,赖剑煌等

研究意义视频目标分割（Video Object Segmentation, VOS）是一项旨在自动分割视频中目标的核心任务，广泛应用于视频编辑、机器人导航、自动驾驶等领域。然而，…

视频技术
2024年12月16日
技术文章

使用 FastAPI 在前端流式传输视频的不同方法

FastAPI 是一个快速、现代的 Web 框架，以支持异步 REST API 和易于使用而闻名。在本文中，我们将了解如何使用 FastAPI 在前端流式传输视频。流式响应 1…

视频技术
2024年11月26日
技术文章

中山大学卢伟团队 | 基于视频流谱特征空间的深度伪造检测

研究意义基于深度伪造技术的篡改视频在社交媒体上广泛传播，部分恶意视频对公众权利和社会稳定造成了极大威胁，深入研究高效的深度伪造检测方法具有重要意义。然而，深度伪造视频在每一帧上表…

视频技术
2024年11月25日
技术文章

LTX-Video：开创性的实时视频生成开源模型，在 ComfyUI 中提供 DayOne 原生支持

Lightricks 是一家以创意工具创新技术进步而闻名的公司，它推出了突破性的视频生成开源模型LTX Video (LTXV)。LTXV 为行业树立了标杆，在发布第一天就在 Co…

视频技术
2024年11月25日
技术文章

微软研究院推出 Reducio-DiT：通过高级压缩技术提高视频生成效率

视频生成模型的最新进展使得人们能够制作出高质量、逼真的视频片段。然而，由于训练和推理所需的计算量，这些模型在大规模实际应用中面临挑战。目前的商用模型如 Sora、Runway Ge…

视频技术
2024年11月22日
技术文章

视频比特率是指什么(视频比特率一般设置为多少)

你可能听说过“比特率”一词。但它是什么？为什么它在视频直播中很重要？它如何连接到其他视频规范？简单地说，视频比特率是构成数字视频文件的每秒比特数。它决定了视频的质量以及播放它需要多…

视频技术
2024年11月8日
技术文章

Meta AI 推出 AdaCache：一种无需训练即可加速视频扩散变换器 (DiT) 的方法

视频生成已迅速成为人工智能研究的焦点，尤其是在生成时间一致、高保真视频方面。该领域涉及创建保持帧间视觉连贯性并随时间保留细节的视频序列。机器学习模型，尤其是扩散变换器 (DiT)，…

视频技术
2024年11月7日
技术文章

SAM2Long：用于长视频分割的 SAM 2 免训练增强版

长视频分割涉及将视频分解成若干部分，以分析运动、遮挡和不同光线条件等复杂过程。它在自动驾驶、监控和视频编辑中有着多种应用。在长视频序列中准确分割对象具有挑战性，但也至关重要。困难在…

视频技术
2024年10月28日
技术文章

基于跨模态对比表征学习的鲁棒视频问答 | 杨勋,曾建明,汪萌等

视频问答是一个具有挑战性且很重要的多媒体理解任务，其需要对底层的视觉内容和高层的文本语义进行综合理解，进而做出正确的决策。

视频技术
2024年10月23日
技术文章

如何在不降低质量的情况下缩小视频尺寸？

随着互联网的发展，视频流媒体服务越来越受欢迎。通过提供简短、生动的视频概述您的操作，这是推销产品或服务的好方法。但当您导出最终视频时，却发现视频文件太大，无法上传到网站或直播流媒体…

视频技术
2024年10月8日
技术文章

IBC 2024 | 基于NeRF的3D视频会议系统

IBC 是历史悠久，规模最大的国际广播及新媒体技术盛会。本工作是上海交通大学图像所 MediaLab 在 IBC 2024 大会成果介绍。本文提出了一种基于预训练神经渲染场 (Ne…

视频技术
2024年9月20日

点击查看更多