技术文章
-
算力网络应用中的广域局域网技术探讨
算力网络可看作是云计算和网络深度融合的高阶2.0版本,旨在打造“一点接入、即取即用”算力服务,让算力如水、电、暖、燃气一样流入千家万户,成为人们日常生活的第五种必备生产资料。算力网…
-
基于即构Flutter直播sdk快速实现直播功能
前文我们介绍了Flutter直播sdk集成指引,在此基础上,本文将介绍如何基于即构Flutter直播sdk快速实现一个简单的直播功能。 Flutter直播相关概念解释 Flutte…
-
在 C# 应用程序中使用 SignalR 进行实时通信:初学者指南
SignalR 是一个用于 ASP.NET 和 .NET 的开源库,它通过 Web 套接字协议提供服务器和客户端之间的双向通信,从而简化了实时 Web 应用程序。SignalR 使…
-
如何使用 WebRTC 和 Firebase 在 React Native 上实现视频通话应用程序
欢迎阅读本综合指南,了解如何使用 WebRTC 和 Firebase 在 React Native 上轻松创建视频通话应用程序。在本教程中,我将一步步带您开发自己的实时视频通信平台…
-
基于极大熵准则的鲁棒信道估计 | 胡正阳, 薛江等
研究背景 信道估计是信号处理中重要且基础的问题之一,尤其是考虑到未来无线通信系统中更高精度的要求。传统的信道估计算法研究主要基于噪声白高斯假设,这限制了传统算法在真实无线通信场景下…
-
CN-Celeb-AV: 多场景视听多模态数据集发布
近日,清华大学语音和语言技术团队联合北京邮电大学发布了中国明星多场景音视频多模态数据集 (CN-Celeb-AV),供音视频多模态身份识别 (AVPR) 等领域的研究者使…
-
心理声学声掩蔽效应及应用
一、声掩蔽效应的定义 由于某个声音的存在而使人耳对别的声音听觉灵敏度降低的现象,称为“声掩蔽效应”。当人耳在倾听一个声音的同时,如果存在另一个声音,就会影…
-
OBS推流工具介绍及桌面录屏推流功能实现
流媒体开发工程中,我们除了使用ffmpeg等工具辅助调试外,还经常使用OBS采集真实的音视频流,进行相关流媒体的流程模拟和调试,本文主要介绍一下OBS基本使用及使用OBS推送实时桌…
-
音频文件格式 Vorbis 编解码
上一篇介绍了OGG音频文件格式,其中涉及到Vorbis编解码,有网友反馈需要介绍一下,所以就查找了一些资料,本文做一下相关内容介绍。 Vorbis 介绍 Ogg Vorbis 是由…
-
AI 可以为 WebRTC 视频应用程序做什么?
人工智能和机器学习可以为您的 WebRTC 应用程序带来众多优势,增强其功能和用户体验。以下是人工智能可以使您的 WebRTC 应用程序受益的一些方法。 语音识别 AI 驱动的语音…
-
什么是VVC?关于 VVC 架构、工具、性能及部署等
本文整理了 Alan Stein 在 Streaming Media East 2023 关于 VVC 的介绍,包括了架构、工具、性能、部署、流媒体等内容。 什么是VVC? VVC…
-
什么是音频中的动态余量?(录音、混音和母带制作)
动态余量是音频技术中的一个基本概念,在数字录音时代经常被忽视,尤其是对于初学者来说。了解音频的基础知识,包括动态余量的定义,将增强您的知识,并最终增强您处理音频时的技能。 什么是音…
-
屏幕图像超分中的B样条纹理系数估计 | CVPR 2023
随着多媒体应用的快速发展,屏幕内容图像(SCI)已在人们日常生活中频繁出现。但是显示设备和SCI之间经常发生分辨率不匹配,并且,SCI有着边缘薄而锐利等特点,与自然图像很不同。然而…
-
苹果AR专利详细分享扫描对象以生成相应3D模型的解决方案
对于AR,扫描对象以生成相应的3D模型是一个重要的过程。所以在名为”Systems and methods for processing scanned objects“的专利申请…
-
Opengl ES之颜色混合
关于混合,其实我们在之前的文章中也有使用到混合的功能了,例如在 Opengl ES之水印贴图 使用混合实现水印贴图。 什么是颜色混合? 颜色混合就是把两种颜色按某种规则混合起来得到…
-
面向大规模实时视频流的Overlay路由决策算法
实时通信(Real-Time Communication, RTC)是一类为用户提供实时的音视频通信服务的互联网应用,包括视频会议、网络电话、互动直播、云游戏、远程控制等形式,应用…
-
基于混合Transformer-CNN结构的学习图像压缩
大多数现有的学习图像压缩方法是基于 CNN 或基于 Transformer 的,它们具有不同的优势。如何有效的利用这两种方法的不同优势是一个值得探索的方向,而这面临着两个挑战:一是…
-
B站幻星数字人3D渲染技术揭秘
一 幻星数字人简介 幻星数字人是天工制作部联合人工智能平台部虚拟人算法组打造的3D数字人解决方案,主要由工业化数字人智能生成管线+AI驱动的表情与动作捕捉系统两部分构成。如上图所示…
-
使用 Spring Boot 的 WebRTC 信令服务器示例
在本文中,我将介绍如何构建一个用于 WebRTC 聊天应用程序的简单信令服务器。我还没有找到很多关于这个主题的文章,所以希望这篇文章能帮助你对 WebRTC 聊天应用程序中的信令操…
-
什么是MV-HEVC?MV-HEVC有什么新特性
什么是MV-HEVC? 针对3D视频、尤其是多视点拼接3D视频的新特性,JCT-3V标准专家组成立,并在2014年发表了适用于3D多视点视频编码的HEVC编码标准扩展:MV-HEV…