按时间归档:2023年
-
使用 Handbrake 的视频压缩:安装和使用指南
Handbrake 是一种开源视频转码器,被广泛认为是视频转换的最佳工具。它使用起来毫不费力,支持多平台,并且涵盖范围广泛的预设和设备。这意味着您会发现比以往任何时候都更容易快速压…
-
视频压缩中的离散余弦变换
离散余弦变换 (DCT)可以说是现代图像和视频压缩中最基本的工具。DCT 用于将像素域中的数据转换为频域,以揭示有关图像或视频帧的洞察力。 本文的目的是让您直观地了解 DCT,而无…
-
数字经济时代 在线社交娱乐行业迎来新的想象空间
连续6年被写入政府工作报告、两会期间再度被高频提及的热词“数字经济”,正成为拉动我国经济增长的新引擎,也成为全球经济竞争的新焦点。 于在线社交娱乐行业而言,随着移动互联网的…
-
首个!火山语音立项有声阅读标准,获CCSA工作组一致通过
日前,中国通信标准化协会(CCSA)互联网与应用标准技术工作委员会(TC1)互联网应用总体及人工智能工作组(WG1)第75次组会在京顺利召开。本次会议由TC1WC1工作组组长曹峰主…
-
填补国际标准空白!海尔智家牵头IEEE智能家居语音标准
理想的智慧生活少不了语音交互,对用户来说,好的语音交互应该是简单一句话,智能家居就能“心领神会”,正确执行。但实际用起来,听不懂老人的方言、距离太远听不清、指令不具体没法执行等…
-
腾讯音乐天琴实验室面向行业首次发布三套开源数据集,助力音视频技术的发展变革
3月13日,腾讯音乐天琴实验室联合清华大学人机语音交互实验室(THUHCSI)、音频语音与语言处理研究组(ASLP@NPU)、CCF计算艺术分会及北京市智慧广电(网络视听)重点实验…
-
万字详解生成式 AI 与 Web3
自 2022 年末 OpenAI 面向公众推出 ChatGPT 以来,人工智能(AI)的热度一直居高不下。圣诞老人来得很早,他给人类带来了一台能回答大多数问题的机器! ChatGP…
-
虚拟现实与元宇宙产业联盟《可信虚拟人生成内容管理系统技术要求》标准制定工作启动
中国信通院CAICT官微3月13日消息,近年来,作为元宇宙和AIGC的关键产业要素,虚拟人概念炙手可热,技术产业发展乘势而起,呈现强劲的增长态势。但是,快速发展的市场机遇下蕴含着一…
-
如何选择正确的高带宽内存(HBM)
尽管多年来一直在努力用更快、更便宜或更通用的存储器来取代DRAM,甚至将其嵌入到SoC中,但DRAM仍然是任何这些架构中的基本组件。DRAM制造商并没有一成不变,而是根据性能、功耗…
-
人工智能如何改变我们与技术互动的方式
ChatGPT在科技界一鸣惊人,截止到2023年1月底,仅在推出两个月后就获得了1亿用户,并带来了一种隐约可见的变革感。 这项技术本身很吸引人,但让ChatGPT特别有趣的部分原因…
-
基于纠缠的量子网络
来自荷兰QuTech的一组研究人员在《科学》杂志论文,报告了连接三个量子处理器的第一个多节点量子网络的实现。此外,他们还进行了关键量子网络协议的原理证明演示,这标志着未来量子互联网…
-
微软推出理解图像内容、解决视觉难题的AI模型
近日,微软的研究人员推出了komos -1,这是一种多模态模型,据报道,它可以分析图像内容,解决视觉难题,执行视觉文本识别,通过视觉智商测试,并理解自然语言指令。研究人员认为,多模…
-
I 帧、P 帧和 B 帧的工作原理及用途
I 帧、P 帧和 B 帧的概念是视频压缩领域的基础。这三种帧类型在特定情况下用于提高编解码器的压缩效率、压缩流的视频质量以及流对传输和存储错误和故障的恢复能力。 在本文中,我们将了…
-
VVC、EVC、LCEVC——MPEG的视频编解码器
VVC、EVC、LCEVC 是 MPEG 在 2020-2021 年发布的三种视频编解码器,分别称为通用视频编码 (H.266)、基本视频编码 (EVC MPEG-5 Part 1…
-
为什么需要视频压缩?视频压缩怎么做
视频压缩是视频制作中最重要的方面之一。YouTube、Facebook 和 Vimeo 等流媒体服务所面临的数据限制通常会阻碍对高质量视觉和声音的需求,以吸引观众的注意力。本文通过…
-
Gstreamer中的视频处理与硬件加速
编者按:Gstreamer作为一个比较流行的开源多媒体框架,其优秀的架构使其具有高度的模块化和良好的扩展性,并具有广泛的应用前景。LiveVideoStackCon2022上海站大…
-
AV1中的IBC技术
HEVC里面的Intra Block Copy (IBC)技术,它是一种基于块的预测技术,与帧间编码的MCP类似,最大的区别是IBC所用的参考像素是来自当前帧的(未滤波)重建部分,…
-
基于时延光子储备池计算的人体动作识别 | 开超,李璞,杨毅等
研究意义 人类动作识别(HAR)在现代工商业中具有广泛的应用,例如视觉监控、自主导航、视频检索、人机交互等等。然而,由于其建模和特征表示从二维空间扩展到三维时空,高效且精确的HAR…
-
AI和ChatGPT正在元宇宙中销售汽车
借助突破性的生成式AI平台ChatGPT驱动的部分支持沉浸式的交互式数字展厅,让在家中舒适地购车很快就会变得更加轻松。 为何重要:菲亚特和起亚都希望通过新推出的“元宇宙”经销店彻底…
-
NVIDIA 推出用于边缘 AI、5G 和 Omniverse 数字孪生的 GPU 加速 AI-on-5G 系统
NVIDIA AI-on-5G 是与 NTT DOCOMO、富士通等携手打造的一体化解决方案,使电信公司能够通过单台服务器来提供沉浸式图形、元宇宙应用和计算机视觉。 电信公司希望获…