技术文章
-
libWebRTC是什么?一文了解libWebRTC使用方式
要了解 libWebRTC 存在的原因及其如此重要的原因,我们应该从 2011 年谷歌首次宣布一个闪亮的网络浏览器新开源项目时的草根开始。 该项目已经转移到一个全新的网站webrt…
-
WebRTC IP 泄漏:您还应该担心吗?
了解 WebRTC IP 泄漏的历史:一个新的 JavaScript 库如何无意中引入隐私问题、它是如何被利用的,以及这个问题得到了多大程度的解决。 在进入本文的精彩部分之前,您需…
-
语音sdk是什么意思?即构语音SDK有哪些优势
语音sdk是什么意思 语音SDK简单来说就是一个软件开发工具包,集合了许多语音服务功能,开发者通过集成SDK可以快速实现各种语音类功能。 即构实时语音SDK(Express Aud…
-
webrtc架构详解(webrtc架构图分析)
对于WebRTC的架构说明,官方的英文文档已经说的很清楚了,所以本文可能更多的是充当这一个翻译者的角色。下面我们从上往下分别了解WebRTC的架构设计。 三层架构 首先我们从Web…
-
PCS 2021 | 视频 VMAF 分数的可微分估计
当前的感知视觉质量评价指标(Perceptual Visual Quality Metrics,PVQMs)通常是复杂且不可微的,这使得它们很难在恢复和压缩调优中用作损失函数,传统…
-
语音模型可根据嘴唇动作识别不同语言
近年来,深度学习技术在许多语言和图像处理任务中取得了显著的成果。这包括视觉语音识别(VSR),它只需要通过分析说话人的嘴唇运动来识别说话的内容。 a-c、基线ASR模型(a)、基线…
-
H.264 编码中, I 帧、B 帧、P 帧、IDR 帧的区别
H.264简介 H.264是新一代的编码标准,以高压缩高质量和支持多种网络的流媒体传输著称。 在H.264协议里定义了三种帧,完整编码的帧叫 I 帧,参考之前的 I 帧生成的只包含…
-
小程序如何实现IM即时通讯多人聊天
目前小程序IM即时通讯多人聊天应用非常广泛,比如电商购物场景,买家和卖家、客服之间需要通信,发送文本、图片、订单等消息;互动直播场景中的弹幕消息、礼物消息,语聊房内的麦位控制等。今…
-
关于 WebRTC 你需要知道的一切
在过去的十五年中,网络变得越来越流行。越来越多的人上网,而且这种趋势只会持续下去。这导致基于 Web 的应用程序越来越受欢迎,并且出于任何给定原因需要更好的在线交流方式——无论是与…
-
音视频开发之 ALSA 实战(开源的音频采集代码分享)
今天我们来分享一个开源的音频采集代码,现在大部分音频采集都是通过ALSA框架去采集,如果大家把ALSA采集代码学懂,那么大部分的音频采集都可以搞定。这个代码是用ALSA进行音频PC…
-
B站直播营收场景技术保障实践
S12决赛尾声,伴随DRX成员们从眼泪到荣耀的升华,技术保障团队的心也松弛下来,逐渐把目光从监控中挪开。一方面分享胜利的喜悦,一方面也为实现了“边喝茶边保障”的目标而高兴。 …
-
WebRTC、RTMP、UDP 三种连麦直播技术方案的对比分析
直播作为一种新兴社交方式,已然成为一项互联网基础应用,也成为技术大牛们探索更高效轻量的技术方案的新阵地。 由于用户对社交互动的强烈需求,“连麦直播”已成为直播的标配。通过视频连麦,…
-
WebRTC直播搭建步骤
虽然直播是一个非常庞大而复杂的功能,但是通过WebRTC来建立直播却并不复杂,只需要几十行代码就可以完成。 搭建直播的步骤: 创建PeerConnectionFactory对象 创…
-
ECCV 2022 | MoFaNeRF: 可变形面部神经辐射场
本文提出了一种参数化模型,使用神经辐射场将自由视图图像映射到编码面部形状、表情和外观的向量空间,即 Morphable Facial NeRF。MoFaNeRF 将编码后的面部形状…
-
音视频开源多媒体框架
多媒体框架是一种在电脑上处理媒体并经网络传播的软件框架。一个良好的多媒体框架提供了一个直观的API和一个模块化的架构而易于添加对新的音频、视频和容器格式以及传输协议的支持。这意味着…
-
Android Camera原理之拍照流程zsl优化方案
一、背景介绍 拍照是手机的基本功能,优化拍照性能,主要是优化点击拍照到生成照片的这一段时间,看看可以在什么地方减少耗时下面将打开camera到拍照完成这段时间拆解一下 这段过程主要…
-
图像识别技术的应用及发展趋势
移动互联网、智能手机以及社交网络的发展带来了海量图片信息,根据BI五月份的文章,Instagram每天图片上传量约为6000万张;今年2月份WhatsApp每天的图片发送量为5…
-
音视频开发:音频PCM和AAC数据格式
在音视频开发中,音频也是一个重要功能之一。在音频开发中有两个重要的概念,一个是PCM数据格式,另外一个是AAC数据格式。下面我们会重点介绍! 一、PCM重要音频参数: PCM数据也…
-
GRTN全球实时传输网络,实现「算力」与「运力」的高效协同
从直播趋势看「分发」与「计算」 阿里云直播产品架构图中,主要分为端和云两个部分:在端侧,主要包含推流端和播放端;在云侧,一是基于分布式节点构建的传输网,二是在阿里云中心构建的不同R…
-
百万人超大房间即时通讯怎么实现?世界杯聊天群就看它了
世界杯 ⚽️ 期间,我与其他的梅西粉丝在某 APP 里建了个梅粉聊天群,群内人数上万人,大家一起讨论赛事热点,可谓热火朝天,此起彼伏,这是四年一度的狂欢,虽值冬季,但热情不减。 “…