技术文章
-
解析蜂窝网络绑定技术在直播中的应用
什么是蜂窝网络绑定、您对它的优势及行业应用感到好奇吗?答案就在这里! 在本文中,我们将分享蜂窝网络绑定的基础知识以及它将如何助力您的直播。事实上我们有一整个系列的技术博…
-
在 Python 中使用 OpenCV 构建 Color Catcher 游戏
你是否曾经想在 Python 中使用 OpenCV 创建自己的游戏? 今天我们将构建一个名为 Color Catcher 的游戏,该游戏挑战玩家使用手部跟踪机制接住从屏幕顶部掉落的…
-
RTMP推流到SRS流媒体服务器metadata,video,audio数据处理
SRS接收到客户端推流后是怎么进行处理、存储的?在进行RTMP握手,消息交互后,执行到SrsRtmpConn::publishing函数,主要包括两部分功能:根据给定的 mount…
-
使用 Flask 和 GStreamer 创建视频转换器
在本教程中,将展示如何使用 Flask 创建一个端点来接收视频文件,将其转换为 mp4,然后将 mp4 返回给用户。 创建要求 安装因使用的操作系统而异。 创建虚拟环境 首先,我们…
-
RTMP推流到SRS流媒体服务器消息处理
本文分享RTMP推流到SRS流媒体服务器消息处理的相关流程。 SRS和客户端是怎么交换消息的?各个消息有什么作用?握手成功后,SRS和客户端进行消息交换,对应wiresharek这…
-
如何使用 OpenCV 和 Python 进行简单的图像压缩
大多数免费图像压缩器都有文件大小要求,使用 python 和 opencv 创建自己的图像压缩器就没有这个烦恼了。在这篇文章中,将展示我是如何做到的,希望它能帮助遇到同样问题的任何…
-
SRS流媒体服务器RTMP握手
RTMP握手简介 rtmp 1.0规范中,指定了RTMP的握手协议: 这个就是srs以及其他开源软件的simple handshake,简单握手,标准握手,FMLE也是使用这个握手…
-
分心感知的伪装物体分割 | 梅海洋,杨鑫,范登平等
研究意义 伪装是动物或物体通过材料、颜色或者光照的任意组合实现的隐藏,以使目标物体难以被看见 (隐身) 或伪装成其他物体 (模仿)。受益于发现“无缝”嵌入其周围环境的伪装物体的能力…
-
面向OTT的可扩展流媒体平台的关键推动因素
流媒体平台在Covid期间和之后彻底改变了娱乐业,允许用户直接通过互联网访问视频和音频内容,而不需要传统的有线电视或付费电视订阅。这种流行导致了市场上众多供应商进入流媒体业务的崛起…
-
音乐驱动数字人技术详解
本文主题为音乐驱动数字人的算法和实践。主要围绕音乐驱动体系 Music XR Maker、音乐生成数字人舞蹈、歌声驱动数字人口型、歌声驱动数字人歌唱表情四点展开。 分享嘉宾|董治 …
-
AIGC产业研究报告2023——三维生成篇
人工智能三维生成是指利用深度神经网络学习并生成物体或场景的三维模型,并在三维模型的基础上将色彩与光影赋予物体或场景使生成结果更加逼真。在应用中,生成物体或场景的三维模型称为三维建模…
-
音频品鉴与歌唱评价——音频内容理解实践
歌唱评价是K歌系统中核心技术之一。近年来,歌唱评价领域也发生着多元化和深度化的变革。本次LiveVideoStackCon 2022 北京站邀请到腾讯音乐天琴实验室高级研究员——江…
-
gstreamer开发常用的工具
gstreamer开发中,一般开发思路为:寻找命令行实现–命令行验证–将命令行集成到代码中—代码工程化。当然如果你要代码更优雅一点,可以用命令行…
-
使用 CNN 进行面部情绪识别
面部表情是人类之间交流的重要方式。 在人工智能研究中,深度学习技术已成为增强人机交互的强大工具。心理学中面部表情和情绪的分析和评估涉及评估预测个人或群体情绪的决定。 本研究旨在开发…
-
三个实际音视频开发问题!
大家好,今天给大家分享的内容是关于平时在做音频编解码会遇到的一些问题,比如说: 这三个问题是最近和同行交流的时候,大家遇到的一些问题,有些朋友一开始,没有思路去解决这种问题! 其实…
-
ZEGO 实时传译上线,提供实时语音识别和文本翻译功能
ZEGO 实时传译(ZegoRealtimeTranslation),是 ZEGO 携手智能语音行业生态服务商提供的实时语音转写及翻译服务,通过 SDK 接入后,提供将音频流实时识…
-
前端3D技术概述(计算机图形学中的3D渲染部分)
操作系统、编译原理、计算机图形学被传为程序员的三大浪漫,每个方向都易懂难深,但作为程序员对每个方向还是要有基本的认识和判断,毕竟贯穿虚拟和现实生活的桥梁是搭建在抽象之上的,这三大浪…
-
SRS流媒体服务器基本流程
SRS流媒体服务器基本流程介绍。 基本流程图 main()、domain()和run_master() 1. main函数所在文件在main/srs_main_server.cpp…
-
边缘计算安全:风险、注意事项和最佳实践
边缘计算固然有其优势,但也伴随着独特的风险和挑战。了解所有这些,以确定边缘计算是否适合您的项目。 计算系统走到哪里,安全威胁就跟到哪里。微软在 1985 年发布了 Windows,…
-
如何在 WebRTC 应用中添加一个语音机器人
语音机器人,也被称为语音助手,是一种使用自然语言处理(NLP)和文本到语音(TTS)技术的机器人,通过语音命令与用户互动。语音机器人被设计为响应口语请求,以对话方式提供信息或执行任…