技术文章
-
AliIAC 智能音频编解码器:在有限带宽条件下带来更高质量的音频通话体验
随着信息技术的发展,人们对实时通信的需求不断增加,并逐渐成为工作生活中不可或缺的一部分。每年海量的音视频通话分钟数对互联网基础设施提出了巨大的挑战。尽管目前全球的互联网用户绝大多数…
-
WebRTC 架构格局正在发生变化
现在有一种新型的 WebRTC 应用程序架构正在发展,称为 WebRTC Unbundling,尽管它可能不适用于所有应用程序场景,但至少在开发新的实时视频开发项目时应该考虑一下它。在过去,三种不同类型的 WebRTC 应用架构即符合标准的 WebRTC、开源媒体服务器和称为 CPaaS 的商业媒体服务器是基于 WebRTC 开发的选项,这三个仍然是有效的架构选择,WebRTC Unbundling 只是第四个选择,可以认为它是符合标准的 WebRTC选项的另一种形式。
-
Android OpenGL ES 实现相机预览
OpenGL ES 相机预览 OpenGL ES 相机预览 相机开发是 OpenGL ES 开发的重要应用,利用 OpenGL 可以很方便地实现相机美颜、滤镜、塑型以及一些动态特效…
-
DPKI的崛起之路——分布式数字身份(DID)
一、引言 互联网的出现和普及使得传统身份有了另一种表现形式,即数字身份,除自然人以外,机构组织、智能设备、虚拟网络都可以作为实体并拥有数字身份,这些实体作为数字化社会的重要组成部分…
-
面向极低码率的概念压缩
本文分享了来自北京大学马思伟教授课题组的工作《Conceptual Compression via Deep Structure and Texture Synthesis》。该论…
-
VR 直播系统,游戏VR直播的注意事项
本文是来自Evolution的技术人员Behnam Kakavand在Demuxed 2021上的演讲。该公司是一个线上游戏公司,旗下的游戏主要是各类线上DC游戏。这类强交互性的桌…
-
使用 CNN 和 TensorFlow 2 对 CIFAR-10 图像进行分类
CIFAR-10是一个由 60000 张彩色图像组成的数据集。数据集分为 50000 张训练图像和 10000 张测试图像。每张图片大小为 32×32,与来自 10 个类…
-
阿里视频云互动虚拟技术,随时随地打造虚拟沉浸直播间
2022是“体育超级大年”,冬奥会、亚运会、大运会、世界杯等各类大型体育赛事贯穿全年。由于受到疫情管控和物理空间的限制,赛事直播至关重要,观众体验需求也在不断升级。 于此,企业对直…
-
webrtc技术详解(webrtc技术架构)
开放互联网和现代计算机的形成例证了科技开放驱动创新成长的能力。HTTP 协议大概是有史以来最伟大的发明之一,计算机可以通过 HTTP 协议从服务器请求和接收数据。 不幸的是,这些创…
-
Web3概念的演进 ——Web3简析系列(4)
当前关于Web3.0,有两个截然不同的概念。一个主要在学术界,一个主要产业界和投资界。
-
Base64URL 编码和解码
Base64URL是一种类似于Base64的编解码方案。Base64 使用一些字符对不能直接在 URL 中使用的数据进行编码。+,/和字符=在 URL 中具有特殊含义,可能会导致错…
-
去中心化Web,Web3流派二 ——Web3简析系列(3)
一、传统Web存在的问题 Web2.0催生了一大批的互联网企业。然而,在Web2.0下,由于平台属于企业,用户的信息、用户的数据都存放在平台上。这种中心化的模式,带来诸多问题,如:…
-
TikTok背后的人工智能如何运作
TikTok 是一款视频分享应用,可让用户创建和分享短视频。它以“只为你”的个性化推荐给用户留下深刻印象。它非常容易上瘾,在 Z 世代中很受欢迎,它的背后是人工智能技术。 Tik…
-
webrtc 回声消除(AEC框架,原理,技术难点以及优化方向)
自 2011 年 WebRTC 开源以来,无论是其技术架构,还是其中丰富的算法模块都是值得我们细细品味,音频方面熟知的 3A 算法(AGC: Automatic gain cont…
-
FFmpeg 框架简读—Bit Stream Filter
在 H.264 中有两种编码的封装格式,一种是 Annex B格式(在ISO-14496-Part 10 的附录B中),一种是 AVCC 格式,也叫 AVC1 格式或 MPEG-4…
-
如何在 web 上构建音频应用程序
主讲人 Hongchan Choi 介绍了在网络上构建音频应用程序的一些想法和考虑,展示一些关于网络媒体制作的一些讨论。 首先抛出一个问题:如果你今天要创建一个网络音频应用程序,你…
-
视频图像处理中的错帧同步是怎么实现的?
1 什么是错帧同步? 一般 Android 系统相机的最高帧率在 30 FPS 左右,当帧率低于 20 FPS 时,用户可以明显感觉到相机画面卡顿和延迟。 我们在做相机预览和视频流…
-
图像处理之三种常见双立方插值算法
图像插值技术概述 图像插值技术在图像几何变换、透视变换等过程中是必不可少的技术环节,可以说像素插值方法最终决定变换之后的图像质量高低。常见的插值方法有 临近点插值 双线性插值 双立…
-
Android 图形系统概述
图形系统是 Android 中非常重要的子系统,与其他子系统相互协作,完成图形界面的渲染和显示。 概述 官方提供了一个图形系统的关键组件协作图,如下所示: 这幅图大致描述了图形数据…
-
ZegoAvatar AI 捏脸技术解析,攻克捏脸技术难点
AI”卷”进实时互动 2021年,元宇宙概念席卷全球,国内各大厂加速赛道布局,通过元宇宙为不同的应用场景的相关内容生态进行赋能。针对“身份”、“沉浸感”、“…