图像处理认证作者
-
图像识别需要了解的 AI 模型
图像识别已成为许多行业不可分割的一部分。这项技术的核心主要围绕更复杂的 AI 图像识别模型。此类模型使机器能够以几乎完美的准确度定位、分类和理解视觉信息。让我们深入了解将图像识别从…
-
DeepSeek AI 发布 JanusFlow:图像理解和生成的统一框架
人工智能驱动的图像生成和理解领域取得了快速进展,但重大挑战阻碍了无缝统一方法的发展。目前,擅长图像理解的模型往往难以生成高质量的图像,反之亦然。需要为每个任务维护单独的架构不仅增加…
-
Khronos 发布 ANARI SDK 更新,为从事 3D 渲染的开发人员提供更强大的工具包
Khronos® Group 通过对 ANARI™ SDK 的最新更新和一次成功的 Hackathon活动,展示了 ANARI API 在实际应用中的强大功能,从而继续推动 3D …
-
STanH:用参数化的量化模块实现变比特率的图像压缩 | TIP 2024
在端到端学习图像压缩中,编码器和解码器联合训练以最小化 R + λD 成本函数,其中 λ 控制量化潜在表示的速率和图像质量之间的权衡。但是,必须为每个 λ 训练具有数百万个参数的不…
-
glTF:现在和未来
glTF™ 已不再只是一种独立的 3D 格式。它现已被采纳为ISO 国际标准,并成为快速扩张的软件工具、标准和扩展生态系统的核心。 鉴于 glTF 在实现跨不同平台、设备和网络的 …
-
图像识别中最强大的深度学习技术
图像识别已成为现代技术的基石,改变着医疗保健、零售、汽车和安防等行业。深度学习技术使机器能够非常准确地识别、分类和解释图像。这一进步的核心是复制人脑处理视觉信息方式的强大算法。下面…
-
JPEG-LM | 利用规范编解码器实现LLMs对图像的高效生成
近期的图像和视频生成工作采用了自回归的大语言模型(LLM)架构,这种架构具有通用性,可能更容易与多模态系统集成。将语言生成中的自回归训练应用于视觉生成的关键在于离散化——也就是将图…
-
InstructG2I:一种基于图形上下文感知的稳定扩散模型,用于从多模态属性图中合成图像
多模态属性图 (MMAG) 尽管在图像生成方面用途广泛,但并未受到太多关注。MMAG 以图形结构的方式表示具有组合复杂性的实体之间的关系。图中的节点包含图像和文本信息。与文本或图像…
-
VCISR:在盲图像超分中考虑视频压缩带来的伪影 | WACV 2024
在盲单图像超分辨率 (SISR) 任务中,现有工作已成功恢复图像级未知退化。然而,当单个视频帧成为输入时,这些工作通常无法解决由视频压缩引起的退化,例如蚊式噪声、振铃、块状和阶梯噪…
-
ICIP 2024 | 一种新的多人人物交互数据集与NVS基准
IEEE ICIP 是历史悠久的图像处理技术盛会。本工作是上海交通大学图像所 MediaLab 在 ICIP 2024的技术成果介绍。近期,在人物交互场景研究中,新视角合成(NVS…
-
DirectX 采用 SPIR-V 作为未来的交换格式
2024 年 9 月 19 日,DirectX 开发博客上发表文章表示,Direct3D 和 HLSL 团队分享了 GPU 可编程性的下一大步。一旦着色器模型 7 发布,Direc…
-
黑电平多减少减,导致图像偏绿偏紫,是怎么推导的?
在调节黑电平的过程中,我们都知道黑电平扣多了图像会偏绿,扣的少了会偏紫,但具体是怎么推导出来的呢?
-
IEEE图像、视频和多维信号处理技术委员会 (IVMSP TC) 征集新TC成员提名
IEEE图像、视频和多维信号处理技术委员会 (IVMSP TC) 的目的是促进和指导图像、视频和多维信号处理领域的发展。这些领域包括 IEEE Transactions on Im…
-
2024 年热门的 AI 图像增强应用程序
在这个数码时代,对数码摄影和图像编辑的需求急剧增加。AI 驱动的图像增强工具已成为初学者和专业摄影师的重要工具。这些 AI 驱动的图像增强器应用程序利用复杂的算法和机器学习技术,将…
-
什么是人脸融合?人脸融合软件有哪些
什么是人脸融合? 人脸融合是一种利用计算机图形学和图像处理技术,将两张或多张人脸图片的特征结合起来,创造出一张新的、结合了参与者特征的人脸图片的技术。 人脸融合的基本步骤通常包括:…
-
为 Vulkan 提供显式管道缓存控制
Vulkan® 工作组发布了VK_KHR_pipeline_binary扩展,可以直接检索与各个管道相关的二进制数据,绕过 VkPipelineCache 机制,并允许应用程序明确…
-
GIMP 3.0 进入字符串冻结期,距离发布越来越近
2024年8月20日,作为 Adobe Photoshop 的主要免费替代软件之一,期待已久的 GIMP 3.0 开源图像编辑器今天开始冻结。 GIMP 3.0 从 GTK2 移植…
-
Vulkan SC 1.0.15 发布:SPIR-V 验证和适用于桌面系统的新 NVIDIA 驱动程序可用
2024 年 6 月 21 日,Khronos® 集团的 Vulkan® SC™ 工作组发布了 Vulkan SC 1.0.15 规范,这是“Vulkan Safety Criti…
-
GTK 在 HDR 方面取得进展并支持更多色彩空间
到目前为止,GTK 工具包中的色彩一直使用 sRGB 表示,但开发人员一直在努力支持其他色彩空间,如 Display-P3 和 BT.2100-PQ,因为他们在努力更好地支持 Li…
-
什么是上下采样?手机如何做上下采样
本期文章为大家讲解关于上下采样的一些知识。主要从手机是如何做上下采样、一些常见的上下采样画质问题等几个方向进行简单的介绍。 上下采样定义 缩小图像(或称为下采样(subsample…