技术文章
-
使用扩散模型实现基于文本的图像编辑 | CVPR 2023
在本文中,作者提出了 Imagic,能够将复杂的文本指导的语义编辑应用于单一真实图像,同时保留其原始特征。与以前的工作不同的是,此方法只需要一张输入图像和一个目标文本,不需要任何额…
-
腾讯云音视频与SRS开源生态
自由与开源软件的理念,从不解、争议、接受到如今如火如荼,经历了长期的历程。国内开源软件起步较晚,但进展迅速。腾讯经过几年的开源协同运动,也取得了不少成绩。其中,腾讯云音视频在FFm…
-
ChatGPT等AIGC如何移动边缘部署?南洋理工最新《 在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系
人工智能生成内容(AIGC)是一种使用人工智能算法创造性地生成、操作和修改有价值和多样化数据的自动化方法。本文重点研究了ChatGPT和Dall-E等AIGC应用在移动边缘网络(m…
-
苹果专利通过包含确定虚拟听觉环境的传感器来推进空间音频的发展
美国时间4月6日,美国专利商标局公布了 Apple 的一项与空间音频相关的专利申请。该专利深入研究了从 AirPods 到 AirPods Max 再到 XR 耳机等设备中的先进传…
-
音视频编解码–PNG格式编码过程
上一篇文章《音视频编解码–PNG介绍》介绍了PNG图像的基本情况,有兴趣的可以翻阅查看,本文进行编码过程的几个重要阶段说明,以期更好理解PNG图像格式。 PNG图像的编码过程是先将…
-
LPC/LSP/LSF之间的关系(从线性预测编码到线谱频率)
我们在阅读语音或者数字信号处理的论文书籍时经常会遇到LPC,LSF和LSP这些和线性预测相关的名词,刚接触时容易一头雾水,今天我们就介绍下它们之间的关系。 LPC/LSP/LSF …
-
2023年 AV1 编码标准成了?
2015年3月,HEVC Advance新成立了一个HEVC专利池,在当年的7月21号它把HEVC的专利授权费用从MPEG LA专利池的0.2美元提高到了0.8美元以上,如果你想用…
-
基于FFmpeg和Wasm的Web端视频截帧方案
基于实际业务需求,介绍了自定义Wasm截帧方案的实现原理和实现方案。解决传统的基于canvas的截帧方案所存在的问题,更高效灵活的实现截帧能力。 作者 | 小萱来源: 百度Geek…
-
为什么 ORAN 对引领下一个网络时代至关重要
在过去的几年里,全球的移动网络在速度、吞吐量、可管理性和成本降低方面取得了前所未有的进步,所有这些都在由在家工作运动等因素引起的惊人的需求激增中证明了它们的价值。 与数字基础设施堆…
-
AI 驱动的 WebRTC 应用程序的非技术指南
从视频会议到在线游戏,实时通信应用已经成为我们日常生活中的一个重要组成部分。我们最近谈到了它在体育产业中的影响,即为流媒体打造的国王联赛。紧随其后,人工智能(AI)正在从科幻故事中…
-
声音信号【音频基础知识】
声音基础 声音我们每天都会听见,这是我们听觉对震动的感知,本质上声音是介质的震动,包括固体液体和空气。振动的物体产生压强变化,这些变化将不断往外部扩散移动,这些压强的变化成为声波。…
-
PCS 2022 | 腾讯多媒体实验室5篇论文入选,含视频压缩、视频数据集、神经网络压缩图像/视频压缩、高维媒体压缩等领域
视觉数据编码顶级国际论坛之一的 PCS 2022 论文入选结果公布!本次,腾讯多媒体实验室共有5篇论文入选,内容含视频压缩、视频数据集、神经网络压缩图像/视频压缩、高维媒体压缩等多…
-
Omdia:OTN延伸至网络边缘是趋势,可实现大带宽、低时延和更优TCO
新的应用和接入技术对光网络的带宽要求越来越高。同时,终端用户对性能的期望值也在提高,从而产生了更严格的服务等级协议(SLA)。此外,运营商在设施和TCO方面受到限制,自动化程度也不…
-
ASPECT: HTTP自适应流的实时盲质量评价 | ICME 2023
在HTTP自适应视频流中,提出了兼具高性能、低延迟、盲评估于一身的质量评价模块,为Adaptive-BitRate算法提供实时指导。 作者:Chunyi Li, May Lim, …
-
Android Studio Gradle下载缓慢的解决方法之一
Android studio每次新建工程都会部署gradle文件,如果下载时间很短,那么不会成为一个问题。由于网络的原因,通常会花费很长的时间,这样是很讨厌的。本文记录了其中的一个…
-
音视频开发的一些学习分享(建议收藏!!!)
本次文章主要是给大家分享音视频的入门学习路线,虽然我之前写过,但是这次我会结合最新接触到不同层次的人来做一个总结分享!当然还是以入门为主,技术点都是当下企业要求必须要掌握的! 事先…
-
RTMP与RTSP协议的区别(RTSP和RTMP优缺点)
RTMP 和 RTSP 都是用于直播的协议。协议规定了从一个通信媒介到另一个通信媒介的数据传输规则。流媒体协议定义了将视频、音频和其他数据传送到观众终端的方法。 流媒体的质量通常取…
-
Kamailio极简websocket脚本
本文提供一个Kamailio路由脚本,仅支持websocket客户端注册。 申请根证书或者用openssl做好自签名证书之后就可以用js.sip或者sipml5等进行注册测试,si…
-
FFmpeg 入门学习 08–打开音视频解码器
使用 FFmpeg 进行音视频解码,其实是一套标准操作,按照固定的流程进行实现即可。 使用 FFmpeg 进行音视频解码的基本流程、及用到的关键 API 接口和 结构体,如下图所示…
-
基于FMCW的新型多域联合调制双功能雷达通信技术
研究意义 FMCW联合雷达通信技术可以在进行探测的同时实现车辆间通信或车辆与基础设施之间的通信,提高资源利用率。传统的车联网通信技术,例如LTE、5G等,需要专门的通信设备和基础设…