技术文章
-
Android音频播放接口AudioTrack详解【Android音视频开发】
Android 中常用的播放音频的接口有MediaPlayer、AudioTrack和SoundPool,音频的渲染最常用的是AudioTrack和OpenSL ES ,…
-
CTC联结时间分类的实现原理和推导公式
CTC应用背景 在语音识别和文字识别的领域,我们的数据集是音频文件和文本,但是,音频文件和文本很难在单位上对齐,比如有人说话快,有人说话慢,有的字符间距离不同,因此这种序列标签的对…
-
音频编码基础和原理
1. 前言 数字音频是把模拟的、连续的声音信号通过采样、量化和编码过程转变成数字信号,然后再进行记录、传输及其他加工处理。重放时再将这些记录的数字音频信号还原为模拟信号,…
-
如何识别图像边缘?
图像识别(image recognition)是现在的热门技术。 文字识别、车牌识别、人脸识别都是它的应用。但是,这些都算初级应用,现在的技术已经发展到了这样一种地步:计算机可以识…
-
Rocket.Chat 为数百万人扩展开源实时消息系统
在本文中,演讲者基于 Rocket.Chat 这一开源的实时消息系统,介绍了其研发团队在解决用户数量增加而带来的应用服务扩展时的对策和具体做法。讲者对系统的两次扩展后服务架构的具体…
-
一文讲透伽马校正丨音视频基础
1、伽马校正 在视频的图像处理中,我们可能在很多地方都听说过伽马校正这个概念,它到底是干什么的呢?这里我们来探讨一下这个概念。 如果大家接触过更早的电视机或电脑显示器,应该知道一种…
-
Android-Native 开发之利用 AAudio 播放音频
谈到在Android C/C++层实现音频播放/录制功能的时候,大家可能首先会想到的是利用opensles去做,这确实是一直不错的实现方式,久经考验,并且适配比较广。 但如果你的项…
-
H.266环路滤波之LMCS亮度映射和色度缩放
1.背景介绍 在H.266里新增了一个Luma Mapping with Chroma Scaling, LMCS工具,对编码前的视频图像进行预处理。正如它的名字一样,它…
-
图像采集:机器视觉图像采集优化方法
机器视觉在不同的复杂技术领域有着广泛应用。在简单的应用中(例如,利用背光检测不透明物体的轮廓),成像系统可在宽松的系统参数条件下可靠地运行。但在要求较高的应用中(比如检测镜面的表面…
-
什么是虚拟主播?虚拟主播是怎么实现的
近些年得益于信息及芯片技术的飞速发展,各种IT新技术层出不穷,物联网, 大数据, 人工智能… 。在众多新技术中,由于应用广泛,未来充满无限可能,‘人工智能’一直热度非凡…
-
WebRTC模块处理机制的实现
1. 前言 WebRTC是一个由Google发起的实时通讯解决方案,其中包含视频音频采集,编解码,数据传输,音视频展示等功能,我们可以通过技术快速地构建出一个音视频通讯应…
-
HEVC编码系统和结构浅析
为了满足海量视频数据的传输和存储要求,在H.264/AVC视频编码标准获得巨大成功后,新一代高效视频编码(High Efficiency Video Coding. HEVC)国际…
-
基于柔性压电声学的多功能可穿戴贴片,可集成传感、定位及水下通信功能
流体动力与机电系统国家重点实验室谢金教授团队联合英国诺森比亚大学傅永庆教授开发了一种基于柔性压电声学的具有传感、通信和定位功能的无线平台。在高频(~13 MHz)刺激下,可激发兰姆…
-
ffmpeg从视频导出gif动图的两种方式
本文记录了如何使用ffmpeg从视频文件生成gif动图的两种方式。 1、使用ffmpeg可以从视频资料直接导出gif动图,这是很常见的场景。 参考命令一: 参数解释: -ss&nb…
-
双11大型互动游戏“喵果总动员” 质量保障方案总结
推荐语:互动游戏是一个系统化工程,在笔者的“喵果总动员”质量方案中,可以看到为保障用户体验,我们在各个难点的解决方案, 例如:用线上压测能力支持业务及时调整各服务容量、通过强化学习…
-
WebRTC iOS 实现视频硬编码
本文分析一下 WebRTC iOS 的视频硬编码实现。iOS 的视频硬编码用到的是 VideoToolbox 库,除了编码,VideoToolbox 还提供了解码、转码等功能。我们…
-
IM专题:分层架构IM系统(7)— Router维护
通过前面文章的分析,我们已经明确,Router 的核心职责是作为中央存储记录在线客户端的连接状态,Router 在本质上是一个内存数据库。 内存是一种易失性的存储,既如此,Rout…
-
基于视频指纹技术的媒资关联性分析与应用
利用视频指纹技术,能够准确、高效地实现媒资内容的关联性比对。本文介绍了视频指纹的提取、建库、比对和判断等环节的技术实现原理,分析了视频指纹技术在内容查重、版本关联、侵权监测和媒资使…
-
在线KTV抢唱体验Demo及示例源码
在线 KTV 是社交娱乐场景下的新型互动玩法,通过歌曲把人与人连接起来,让沟通破冰变得更简单,有效提升平台用户停留时长。 抢唱:用户可根据自己的爱好选择不同分类的歌曲房间,房间内随…
-
浅析opensips负载均衡模块
opensips是一个成熟的开源SIP服务器,除了提供基本的SIP代理及SIP路由功能外,还提供了一些应用级的功能。opensips可定制各种路由策略,应用于语音、视频通信、IM以…