按时间归档:2023年
-
每个人都需知道的 Web 3.0 的主要特征
Web 3.0 确实是当今互联网的未来版本,它将完全基于公共区块链。公共区块链是指以执行加密交易而闻名的记录保存系统。与其前身不同,Web 3.0 的关键特征是其去中心化机制,通过…
-
视频RTMP推流方案(基于librtmp实现推流)
对应RTMP推流,业界有很多开源方案。如使用ffmpeg推流,librtmp(rtmp-dump),gstream推流。由于ffmpeg和gstreamer比较庞大,仅仅用来推流,…
-
windows平台桌面截屏技术(GDI, DDRAW和DXGI三种抓屏方式)
windows系统中,抓取屏幕有很多方法,比较常用的是GDI和mirror两种方式,除此以外,利用ddraw和DXGI(windows7以上系统支持)方式也可以抓取屏幕。由于mir…
-
多媒体文件格式M3U8剖析
“M3U” 和 “M3U8” 文件都是苹果公司使用的 HTTP Live Streaming(HLS) 协议格式的基础;是 Unic…
-
多媒体文件格式FLV剖析(FLV分析工具)
本文介绍一种常用的流式媒体格式,就是FLV,FLV全称为Flash Video,一听就知道是Adobe 公司推出的一种媒体封装格式。下面我们剖析一下FLV媒体的格式内容。 FLV分…
-
语音通话AI降噪技术
在日常生活中,噪声是影响语音通话质量的重要因素之一。语音降噪技术通过消除噪声并提取干净语音,从而提高语音质量和可懂度,在移动通信、耳机、会议系统、语音交互等应用中具有巨大价值。近年…
-
一文理清直播全过程(直播推流端和拉流端)
本文分享完整的直播需要的流程,理清主播到观众之间的交互过程,包括直播推流端和拉流端的具体步骤。 试想一下,主播在这边捧着手机,表演一番,然后粉丝们在另外一边拿着手机看得津津有味,其…
-
微软必应步子迈得太大,聊天机器人是有个性还是在扯淡
当年为了让人工智能人人可用,马斯克与奥特曼等共同创办了OpenAI。今天微软要把ChatGPT加持的搜索产品必应推向亿万用户,马斯克不安了,害怕了。 一位名叫Jacob Roach…
-
基于空中计算的应急通信网络中任务调度与无人机部署联合优化算法
Zhang T K, Chen C B, Xu Y, Loo J & Xu W J. Joint Task scheduling and mu…
-
重塑元宇宙体验!3DCAT元宇宙实时云渲染解决方案来了
元宇宙作为人工智能、云计算和数字孪生等前沿技术的结合体,近年来越发受到各大企业重视。 元宇宙的应用场景层出不穷,不仅包括营销推广场景,还有品牌活动和电商销售,能有效提升品宣和商业转…
-
视频云背后的硬核实力
算力时代,靠吃「硬件红利」便能搞定新应用场景的「甜蜜期」已经过去。 人类社会的每一次科技跃迁,其本质都是计算力的突破与演进。 算盘拨出农耕文明的繁荣,机械计算机催生出第一次工业革命…
-
2023年中国直播电商发展洞察
直播电商作为一种高效便捷的线上售卖方式,已经逐渐渗透到电商消费的各个环节,直播已经成为电商平台标配且在日常促销与年度大促上占据重要地位,当前行业发展主要呈现出直播电商化、电商直播化…
-
研究人员为低成本轻量级机器人实现基于声音的定位和映射功能
蝙蝠具有在黑暗中行动的能力,即使它们无法在视觉上感知周围环境。这种能力基于它们发射的超声波产生独特的回波模式,提供有关附近感兴趣物体或障碍物位置的信息。 图片源于:Dümbgen …
-
Integem宣布与NVIDIA合作,为K-12推出AR、AI和机器人教育体验
全息AR技术和教育供应商Integem宣布将与NVIDIA AI Education合作,为K-12学生带来3D全息AR、AI和机器人教育体验。在重塑世界的AI革命中,让更多年轻学…
-
清博智能虚拟人及高仿机器人双双亮相数博会!
2月16日,第十二届中国数字出版博览会在京举行,清博智能荣誉出品的虚拟人及高仿机器人双双亮相数博会。 本届数博会吸引了多家出版行业公司参展,人工智能、大数据、云计算、AR、VR等新…
-
网心科技李浩:端边云协同,打造沉浸式虚拟现实新体验
2月16日,冰城论道暨第24届中国智能视听与科技创新高峰论坛在哈尔滨举办。网心科技CEO李浩受邀出席论坛,并发表《端边云协同,打造沉浸式虚拟现实新体验》主题演讲,他提出边缘计算从低…
-
解锁抖音世界杯的画质优化实践
卡塔尔世界杯已经结束,29天赛程,64场比赛,最终梅西带领阿根廷时隔三十六年再次捧杯。世界杯期间,抖音提供的稳定高质直播画面为观众带来了完美的观赛体验,决赛的PCU高达3700W+…
-
多智能体RL实现多轮连续交互,IteR-MRL使图像分割算法达到医用标准
如何提高交互式图像分割算法的效率?上海交大和华师大的研究者提出了一种基于多智能体深度强化学习的新型算法。 现有的交互式图像分割算法虽然能迭代式地更新分割结果,但很大程度上忽略了对连…
-
焕新沉浸式旅行体验,首档VR治愈系慢综《寻声而来VR版》开播
全国首档VR治愈系慢综《寻声而来VR版》正式开播。该节目由移动云VR出品,依托中国移动5G优势,借助8K+VR技术手段,360°全方位寻声福建各地。 节目以声音为切入口,采集八闽之…
-
AI 看唇语,在嘈杂场景的语音识别准确率高达75%
事实上,研究表明视觉线索在语言学习中起着关键的作用。相比之下,人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练,通常需要数万小时的记录。 为了研究视觉效果,尤其是嘴部…