技术文章
-
Vimeo的转码设施升级之旅
编者按:随着Google Cloud等基础设施更加成熟,通过使用更加廉价的竞价实例,可以大幅的降低成本。通过开发新的基础设施管理平台——Falkor,Vimeo的运营成本也大幅降低…
-
TEA-PSE 3.0: 深度噪声抑制(DNS)竞赛个性化语音增强冠军方案解读 |ICASSP2023
实时通信 (RTC) 在我们的日常生活中变得不可或缺,诸如腾讯会议在内的语音RTC应用已经成为我们日常使用的在线交流工具。然而在通话过程中,语音质量受到背景噪声、混响、干扰说话人等…
-
客服IM消息列表虚拟滚动技术实践|得物技术
1 场景分析 在IM系统中,核心事件都是围绕着“聊天”这个主题展开的,在聊天的过程中,获悉用户的需求,再通过系统集成的各种工具,帮助用户完成诉求;“聊天”在IM业务中就是“会话消息…
-
OTN网络算力接入时延圈绘制展示研究和实践
摘要:研究基于OTN网络进行算力接入时延圈绘制展示的方法并在现网部署。算网大脑通过向OTN控制器查询获取以指定机房为中心,小于等于指定时延指标的所有机房节点的信息。基于这些节点的地…
-
基于预训练和图网络的语音主题分类 | IEEE ICME 2023论文
研究背景:随着网络科技的不断进步,短视频的个性化推荐,会议的录音记录等相关的音频信息在我们的生活中扮演着越来越重要的作用。如何能在海量的语音信息中,准确的进行语音信息的分类和定位,…
-
Electron 如何操作本地的音视频设备
之前的文章中提到过,安卓等移动端APP在采集音视频数据时,需要打开本地摄像头和麦克风设备。同理,桌面端应用程序在采集音视频数据时也需要依赖本地的音视频设备,今天本文的主要内容就是讨…
-
比较人类产生的语言和 NLP 产生的语言之间的神经活动差异
自然语言处理 (NLP) 是与机器和我们之间交流的核心,NLP 研究领域长期以来一直在寻求产生人类质量的语言,确定用于衡量 NLP 生成的语言质量的信息标准将支持开发更好的 NLP…
-
音视频编解码—GIF2 代码走读
上一篇文章讲解了GIF格式基本内容,本文进行gif的代码分析。主要参考FFMPEG 5.0 中相关代码逻辑,一方面FFMPEG集成度比较高,通用性好,对于学习理论有更好的适用性;另…
-
Mac端搭载Vulkan的开发环境
本文为Vukan学习系列的第三篇文章,主要内容为在Mac端搭载Vulkan的开发环境。 后续的内容都是先基于Mac开发,系列内容讲解完毕后再迁移到Android平台。 首先确保Ma…
-
Vulkan 相比于 OpenGL 优势在哪?
1. Vulkan起源和历史 1.1 AMD Mantle 2013年,AMD主导开发了Mantle。Mantle是面向3D游戏的新一代图形渲染 API,可以让开发人员直接操作GP…
-
AV1中的ARF和Overlay Frame
前文中我简单介绍了AV1视频编码标准里的参考帧,今天就接着继续来谈谈其中的ARF和对应的Overlay Frame。 ARF是Alternative Reference …
-
CVPR2023: 从因果视角出发,探索失真不变表征-图像修复学习新范式
近年来,我们见证了深度神经网络在图像修复方面的重大进展。然而,关键局限性在于其仅能拟合相关性,无法很好地适应不同程度或类型的真实场景退化。本文从因果学习的全新角度建模分析图像修复,…
-
FIM (Fbi IMproved) 通用图像浏览器 | FOSDEM 2023
FIM(Fbi IMproved)是一个轻量级通用图像查看器。你可以在 Linux Framebuffer 下、X 下或文本终端 ASCII Art 中使用它,FIM 具有一致的界…
-
IM专题:分层架构IM系统(13)—时间轮方案实现
在上一篇 IM专题:分层架构IM系统(12)—消息收发逻辑实现 文章中,我们分析了 IM 的分层架构中的消息收发逻辑;为了实现消息的 “及时性” 和 “可靠性”,将整个消息收发流…
-
RabbitMQ、RocketMQ、Kafka性能为何差距如此大?
MQ的作用解耦、异步、削峰填谷。 未使用MQ的情况 mysql并发写大部分情况下维持在600-800之间,并发读1200-1500之间,所以消费端在消费消息的时候需控制在并发小于1…
-
使用 Python 进行面部和眼睛检测
通过使用 OpenCV,你可以识别面部和眼睛等对象,并使用 Haar 级联算法实时跟踪它们。 Haar Cascade 是一种分类器,用于检测其训练对象。我们将使用 Face ca…
-
AVX-512 在 FFmpeg 中的应用 | FOSDEM 2023
本文介绍了 AVX-512 在 FFmpeg 中的应用。首先,本文介绍了 AVX-512 的基本信息,包括它与 SIMD 指令集的关系、其特点和新型指令。接着,本文探讨了 AVX-…
-
WebRTC 实战: P2P 音视频通话解决方案
本文将详细介绍如何利用 WebRTC 技术实现 P2P 音视频通话,并提供了一个跨平台的方案,包括:基于 socket.io&nb…
-
算力网络场景下SLA约束的能耗优化微服务调度策略
摘要:针对算力网络场景下的微服务调度问题,考虑了微服务对网络服务质量的需求和节点能耗优化问题,研究了算力网络场景下服务质量约束的能耗优化微服务调度问题。首先建立了由算力网络调度模块…
-
基于5G MR指纹的室内定位技术研究
摘要:5G蜂窝网络在为终端提供无线通信功能的同时,也可以提供定位功能。基于5G MR指纹的室内定位技术,可以在不需(或不能)额外布设信源设备情况下,满足室内定位的基本要求。首先概述…