技术文章
-
Instruct-NeRF2NeRF: 引导并编辑NeRF
本文提出了一种通过文本来编辑 NeRF 场景的方法。给定一个 NeRF 场景及用于重建它的多视角图像,本方法利用图像条件扩散模型InstructPix2Pix对输入图像进行迭代编辑…
-
如何为 WebRTC 应用程序提供出色的体验
在WebRTC.ventures,我们相信,如果一个技术上健全的WebRTC应用不能提供积极的用户体验,那么它是不够的。我们把伟大的体验放在首位,认识到即使是最先进的应用,如果不能…
-
SRS单机模式搭建,基于阿里云ECS服务器
SRS 是一个简单、高效的实时视频服务器,支持RTMP/WebRTC/HLS/HTTP-FLV/SRT/MPEG-DASH/GB28181、Linux/Windows/MacOS、…
-
COTS实用媒体处理平台构建案例 | SMPTE Motion Imaging Journal 2023
为了在商用非专用硬件上使用来自不同供应商的元素构成可扩展的基于软件的广播系统,并避免在设施和云中的锁定,需要采用混合多云方法。作为一个案例研究,本文构建了一个可扩展的边缘平台,用于…
-
Jetson Nano 是学习 AI 边缘计算的神器
笔者从 2019 年开始使用 NVIDIA Jetson Nano 开发套件,一开始是被 NVIDIA 当时推出的 Jetbot 智能小车所吸引,这套 2,00…
-
必须要掌握的音视频编码、解码基础!
音视频为什么要编码? 音视频编码技术在音视频领域有着举足轻重的地位,这是由于音视频原始数据量较大,在传输的过程中如果不进行编码的话,则无法进行传输。比方说,一张普通的图片的大小大概…
-
视频编码测试平台CodecWar
在视频编码的研究和开发中,我们经常需要对编码器的性能进行比较,一般的做法是构建一个数据集,然后将两个编码器在同一个配置上(LD,RA,AI等)使用不同参数(CQP下一般为4个QP值…
-
通过 OTT 进行高度可扩展和冗余的直播
ZEE 重新开始了国际 T20 联赛的体育直播,在 Zee5,这是我们第一次向终端用户提供体育直播的工作。 为了确保我们在每个比赛日都能获得正确的数据流,这是一个艰难的旅程——从接…
-
Meta为实时渲染参数化3D手部模型提出神经重照明框架
近年来,神经渲染方法显著提高了人脸渲染真实感。相关方法使用深度神经网络对人类皮肤上的光传输进行建模,通过重建真实图像直接再现物理效应,如亚表面散射。然而,尽管神经重照明取得了成功,…
-
当 MQTT 遇上 ChatGPT:探索可自然交互的物联网智能应用
随着物联网技术的迅猛发展,人与设备、设备与设备之间的互动已变得不再困难,而如何更加自然、高效、智能地实现交互则成为物联网领域新的挑战。 近期,由 OpenAI 发布的 ChatGP…
-
5G 高低频协同上行增强技术研究
摘要:时频双聚合技术用于 SA 网络架构,在载波聚合技术基础上,通过较低频的 2.1 GHz FDD 载波来辅助较高频段的 3.5 GHz TDD 载波来实现上行覆盖增强,同时下行…
-
OpenGL Shader 编程基础-绘制基础图形
我们可以通过顶点着色器来绘制点线面图形,并组合成其他各种形状,但是一般 2D 场景中,顶点着色器一般都不改,并且它一般决定的是整个画布的大小。 所以这里探讨的是通过片元着色器来绘制…
-
智能感知编码优化与落地实践
基于人眼视觉特性出发的感知编码优化技术,成为互联网短视频、OTT 等 UGC 场景的重点优化手段,可以在降低视频码率的同时,提升视频的观看体验。 今天主要有 4 个方面的内容。首先…
-
5G网络分流比提升方法研究
摘要:分析了5G网络分流比的影响,从5G终端功能打开统计分析、5G网络覆盖情况分析、4G/5G网络无法共址建设原因以及4G/5G互操作参数设置情况分析了5G分流比低的原因,提出了提…
-
杜比 Ac-4 与 MPEG-H:下一代音频编解码器
下一代音频 (NGA) 的两个领先实现是杜比 AC-4 和 MPEG-H。尽管它们都基于 ITU 的一套核心建议,但它们有不同的起源、优势和局限性。 杜比 AC-4 与 MPEG-…
-
如何以实时精度完善 5G 场内体验
随着 5G 服务提供商宣布改变人们在体育场馆和音乐厅参加活动时的体验的头条新闻承诺,这些努力面临的尚未解决的挑战被忽视了。简而言之,仅靠 5G 无法可靠地提供具有完美同步的直播和屏…
-
WebRTC RTCP协议 PLI、FIR 请求关键帧
本篇文章主要介绍rtcp的反馈包,在音视频通话过程中反馈包是接收端用来通知发送端的消息。 RTCP 反馈包 反馈包详情见:rfc4585 反馈包协议格式: 协议字段介绍 versi…
-
WebRTC Android 视频硬件编码
本文将重点介绍在 Android 平台上,WebRTC 是如何使用 MediaCodec 对视频数据进行编码,以及在整个编码过程中 webrtc native 与 java 的流程…
-
B站公布新专利,可在车载场景下语音发布弹幕
5 月 14 日消息,上海哔哩哔哩科技有限公司申请的“弹幕处理方法及装置”专利公布,实现了在车载场景的情况下使用语音发布弹幕。 IT之家附专利摘要: 本申请提供弹幕处理方法及装置,…
-
音视频编解码WebP格式
WebP 是一种由 Google 开发的图像格式,旨在提供比传统 PNG 和 JPEG 格式更高效的压缩算法。它可以在保持很好的视觉质量的同时减小文件大小,从而加快图像加载速度并降…