图像处理的文章 - 实时互动网个人中心 - 实时互动网

图像处理认证作者

这个人很懒，什么都没有留下～

357 文章

0 评论

2 粉丝

技术文章

JPEG AI 模糊了真实与合成之间的界限

今年 2 月，JPEG AI 国际标准发布，经过数年的研究，该标准旨在利用机器学习技术，在不降低感知质量的前提下，生成更小、更易于传输和存储的图像编解码器。这一事件很少成为头条新…

图像处理
2025年4月11日
技术文章

Datoviz：基于 Vulkan 的超高速、高性能 GPU 科学可视化库

Datoviz 是一个跨平台、开源的高性能 GPU 科学数据可视化库，专为大规模数据集的交互式探索而设计。它采用 C/C++ 编写，基于 Khronos Vulkan® 图形 AP…

图像处理
2025年3月27日
技术文章

使用 OpenCV 和 Tesseract-OCR 在 Google Colab 中构建 OCR 应用程序的编码指南

光学字符识别 (OCR) 是一种强大的技术，可将文本图像转换为机器可读的内容。随着数据提取自动化的需求日益增长，OCR 工具已成为许多应用程序的重要组成部分，从数字化文档到从扫描图…

图像处理
2025年3月18日
技术文章

DFSQ：用于超分辨率网络的分布灵活的子集量化方法 | 厦门大学纪荣嵘团队

研究意义图像超分辨率（SR）技术旨在从低分辨率图像中恢复高分辨率图像，广泛应用于医学影像、视频增强和卫星图像处理等领域。然而，现有的SR模型通常依赖庞大的网络规模和计算资源，难以…

图像处理
2025年2月19日
技术文章

One-D-Piece：图像Tokenizer满足质量可控压缩

当前的图像标记化方法需要大量标记来捕获图像中包含的信息。尽管图像的信息量不同，但大多数图像分词器仅支持固定长度的分词化，导致分词分配效率低下。在本研究中，本文介绍了 One-D-P…

图像处理
2025年2月19日
技术文章

用基础扩散模型实现有损图像压缩 | ECCV 2024

将扩散模型纳入图像压缩领域，有可能产生逼真而详细的重建效果，尤其是在比特率极低的情况下。以往的方法主要是将扩散模型用作对条件信号中的量化误差具有鲁棒性的表达式解码器。然而，要以这种…

图像处理
2025年2月12日
技术文章

Meta AI 推出 CLUE：旨在解决传统图像安全系统缺陷的 AI 框架

数字平台的快速发展使图像安全问题成为关注焦点。从露骨的内容到暴力的描述，有害图像给内容审核带来了巨大挑战。人工智能生成内容（AIGC）的激增加剧了这些挑战，因为先进的图像生成模型可…

图像处理
2025年1月14日
行业资讯

OpenGL 正在开发跨供应商网格着色

鉴于现代 Vulkan 应用程序接口的持续广泛采用，新的 OpenGL 扩展（尤其是令人兴奋的扩展）在近来非常罕见，但在 2025 年，我们将通过 GL_EXT_mesh_shad…

图像处理
2025年1月8日
技术文章

微软和清华大学推出Distilled Decoding：在自回归模型中加速图像生成而无质量损失的新方法

自回归 (AR) 模型改变了图像生成领域，为生成高质量视觉效果树立了新标杆。这些模型将图像创建过程分解为连续步骤，每个标记都基于先前的标记生成，从而创建具有出色真实感和连贯性的输出…

图像处理
2024年12月27日
行业资讯

2024 年 HDR 技术的进步指向更加光明的 2025 年

2024 年，随着消费者对娱乐需求的不断增长，越来越多的内容提供商将目光投向了高动态范围（HDR）和广色域（WCG），以期在拥挤的市场中脱颖而出，我们预计明年这一趋势仍将持续。尽…

图像处理
2024年12月25日
技术文章

图像识别需要了解的 AI 模型

图像识别已成为许多行业不可分割的一部分。这项技术的核心主要围绕更复杂的 AI 图像识别模型。此类模型使机器能够以几乎完美的准确度定位、分类和理解视觉信息。让我们深入了解将图像识别从…

图像处理
2024年11月18日
技术文章

DeepSeek AI 发布 JanusFlow：图像理解和生成的统一框架

人工智能驱动的图像生成和理解领域取得了快速进展，但重大挑战阻碍了无缝统一方法的发展。目前，擅长图像理解的模型往往难以生成高质量的图像，反之亦然。需要为每个任务维护单独的架构不仅增加…

图像处理
2024年11月14日
行业资讯

Khronos 发布 ANARI SDK 更新，为从事 3D 渲染的开发人员提供更强大的工具包

Khronos® Group 通过对 ANARI™ SDK 的最新更新和一次成功的 Hackathon活动，展示了 ANARI API 在实际应用中的强大功能，从而继续推动 3D …

图像处理
2024年11月8日
技术文章

STanH：用参数化的量化模块实现变比特率的图像压缩 | TIP 2024

在端到端学习图像压缩中，编码器和解码器联合训练以最小化 R + λD 成本函数，其中 λ 控制量化潜在表示的速率和图像质量之间的权衡。但是，必须为每个 λ 训练具有数百万个参数的不…

图像处理
2024年11月6日
技术文章

glTF：现在和未来

glTF™ 已不再只是一种独立的 3D 格式。它现已被采纳为ISO 国际标准，并成为快速扩张的软件工具、标准和扩展生态系统的核心。鉴于 glTF 在实现跨不同平台、设备和网络的 …

图像处理
2024年10月29日
技术文章

图像识别中最强大的深度学习技术

图像识别已成为现代技术的基石，改变着医疗保健、零售、汽车和安防等行业。深度学习技术使机器能够非常准确地识别、分类和解释图像。这一进步的核心是复制人脑处理视觉信息方式的强大算法。下面…

图像处理
2024年10月29日
技术文章

JPEG-LM | 利用规范编解码器实现LLMs对图像的高效生成

近期的图像和视频生成工作采用了自回归的大语言模型（LLM）架构，这种架构具有通用性，可能更容易与多模态系统集成。将语言生成中的自回归训练应用于视觉生成的关键在于离散化——也就是将图…

图像处理
2024年10月17日
技术文章

InstructG2I：一种基于图形上下文感知的稳定扩散模型，用于从多模态属性图中合成图像

多模态属性图 (MMAG) 尽管在图像生成方面用途广泛，但并未受到太多关注。MMAG 以图形结构的方式表示具有组合复杂性的实体之间的关系。图中的节点包含图像和文本信息。与文本或图像…

图像处理
2024年10月12日
技术文章

VCISR：在盲图像超分中考虑视频压缩带来的伪影 | WACV 2024

在盲单图像超分辨率 (SISR) 任务中，现有工作已成功恢复图像级未知退化。然而，当单个视频帧成为输入时，这些工作通常无法解决由视频压缩引起的退化，例如蚊式噪声、振铃、块状和阶梯噪…

图像处理
2024年9月30日
技术文章

ICIP 2024 | 一种新的多人人物交互数据集与NVS基准

IEEE ICIP 是历史悠久的图像处理技术盛会。本工作是上海交通大学图像所 MediaLab 在 ICIP 2024的技术成果介绍。近期，在人物交互场景研究中，新视角合成（NVS…

图像处理
2024年9月29日

点击查看更多