图像处理认证作者
-
Meta AI 推出 CLUE:旨在解决传统图像安全系统缺陷的 AI 框架
数字平台的快速发展使图像安全问题成为关注焦点。从露骨的内容到暴力的描述,有害图像给内容审核带来了巨大挑战。人工智能生成内容(AIGC)的激增加剧了这些挑战,因为先进的图像生成模型可…
-
OpenGL 正在开发跨供应商网格着色
鉴于现代 Vulkan 应用程序接口的持续广泛采用,新的 OpenGL 扩展(尤其是令人兴奋的扩展)在近来非常罕见,但在 2025 年,我们将通过 GL_EXT_mesh_shad…
-
微软和清华大学推出Distilled Decoding:在自回归模型中加速图像生成而无质量损失的新方法
自回归 (AR) 模型改变了图像生成领域,为生成高质量视觉效果树立了新标杆。这些模型将图像创建过程分解为连续步骤,每个标记都基于先前的标记生成,从而创建具有出色真实感和连贯性的输出…
-
2024 年 HDR 技术的进步指向更加光明的 2025 年
2024 年,随着消费者对娱乐需求的不断增长,越来越多的内容提供商将目光投向了高动态范围(HDR)和广色域(WCG),以期在拥挤的市场中脱颖而出,我们预计明年这一趋势仍将持续。 尽…
-
图像识别需要了解的 AI 模型
图像识别已成为许多行业不可分割的一部分。这项技术的核心主要围绕更复杂的 AI 图像识别模型。此类模型使机器能够以几乎完美的准确度定位、分类和理解视觉信息。让我们深入了解将图像识别从…
-
DeepSeek AI 发布 JanusFlow:图像理解和生成的统一框架
人工智能驱动的图像生成和理解领域取得了快速进展,但重大挑战阻碍了无缝统一方法的发展。目前,擅长图像理解的模型往往难以生成高质量的图像,反之亦然。需要为每个任务维护单独的架构不仅增加…
-
Khronos 发布 ANARI SDK 更新,为从事 3D 渲染的开发人员提供更强大的工具包
Khronos® Group 通过对 ANARI™ SDK 的最新更新和一次成功的 Hackathon活动,展示了 ANARI API 在实际应用中的强大功能,从而继续推动 3D …
-
STanH:用参数化的量化模块实现变比特率的图像压缩 | TIP 2024
在端到端学习图像压缩中,编码器和解码器联合训练以最小化 R + λD 成本函数,其中 λ 控制量化潜在表示的速率和图像质量之间的权衡。但是,必须为每个 λ 训练具有数百万个参数的不…
-
glTF:现在和未来
glTF™ 已不再只是一种独立的 3D 格式。它现已被采纳为ISO 国际标准,并成为快速扩张的软件工具、标准和扩展生态系统的核心。 鉴于 glTF 在实现跨不同平台、设备和网络的 …
-
图像识别中最强大的深度学习技术
图像识别已成为现代技术的基石,改变着医疗保健、零售、汽车和安防等行业。深度学习技术使机器能够非常准确地识别、分类和解释图像。这一进步的核心是复制人脑处理视觉信息方式的强大算法。下面…
-
JPEG-LM | 利用规范编解码器实现LLMs对图像的高效生成
近期的图像和视频生成工作采用了自回归的大语言模型(LLM)架构,这种架构具有通用性,可能更容易与多模态系统集成。将语言生成中的自回归训练应用于视觉生成的关键在于离散化——也就是将图…
-
InstructG2I:一种基于图形上下文感知的稳定扩散模型,用于从多模态属性图中合成图像
多模态属性图 (MMAG) 尽管在图像生成方面用途广泛,但并未受到太多关注。MMAG 以图形结构的方式表示具有组合复杂性的实体之间的关系。图中的节点包含图像和文本信息。与文本或图像…
-
VCISR:在盲图像超分中考虑视频压缩带来的伪影 | WACV 2024
在盲单图像超分辨率 (SISR) 任务中,现有工作已成功恢复图像级未知退化。然而,当单个视频帧成为输入时,这些工作通常无法解决由视频压缩引起的退化,例如蚊式噪声、振铃、块状和阶梯噪…
-
ICIP 2024 | 一种新的多人人物交互数据集与NVS基准
IEEE ICIP 是历史悠久的图像处理技术盛会。本工作是上海交通大学图像所 MediaLab 在 ICIP 2024的技术成果介绍。近期,在人物交互场景研究中,新视角合成(NVS…
-
DirectX 采用 SPIR-V 作为未来的交换格式
2024 年 9 月 19 日,DirectX 开发博客上发表文章表示,Direct3D 和 HLSL 团队分享了 GPU 可编程性的下一大步。一旦着色器模型 7 发布,Direc…
-
黑电平多减少减,导致图像偏绿偏紫,是怎么推导的?
在调节黑电平的过程中,我们都知道黑电平扣多了图像会偏绿,扣的少了会偏紫,但具体是怎么推导出来的呢?
-
IEEE图像、视频和多维信号处理技术委员会 (IVMSP TC) 征集新TC成员提名
IEEE图像、视频和多维信号处理技术委员会 (IVMSP TC) 的目的是促进和指导图像、视频和多维信号处理领域的发展。这些领域包括 IEEE Transactions on Im…
-
2024 年热门的 AI 图像增强应用程序
在这个数码时代,对数码摄影和图像编辑的需求急剧增加。AI 驱动的图像增强工具已成为初学者和专业摄影师的重要工具。这些 AI 驱动的图像增强器应用程序利用复杂的算法和机器学习技术,将…
-
什么是人脸融合?人脸融合软件有哪些
什么是人脸融合? 人脸融合是一种利用计算机图形学和图像处理技术,将两张或多张人脸图片的特征结合起来,创造出一张新的、结合了参与者特征的人脸图片的技术。 人脸融合的基本步骤通常包括:…
-
为 Vulkan 提供显式管道缓存控制
Vulkan® 工作组发布了VK_KHR_pipeline_binary扩展,可以直接检索与各个管道相关的二进制数据,绕过 VkPipelineCache 机制,并允许应用程序明确…