文章分类
-
视频服务和流媒体行业 2024 年展望:人工智能仍然是焦点
一月份才刚刚过去,但我们已经开始期待下一届 IBC,它将像往常一样于九月在阿姆斯特丹 RAI 举行。与此同时, Content Everywhere 正在擦亮他们的水晶球,预测未来…
-
数字人虚拟偶像进军影视行业,虚拟数字人成企业入局元宇宙必修课
近日,新生代虚拟偶像许星悠“本色出演”的国产原创校园篮球动画剧集《左手上篮》在腾讯视频和腾讯体育全网首播。与此同时,《左手上篮》及旗下数字藏品平台NXTF_携手运动品牌Wilson…
-
Observe.AI 推出实时代理和主管辅助工具
Observe.AI 发布了一个实时 AI 套件,通过实时指导工具协助代理。 这样做的目的是解决座席在与客户互动之前、之中和之后面临的常见挑战。 利用座席绩效数据和历…
-
「智能媒体生产」系列课程第一讲:概念、原理和基本使用
本文内容整理自「智能媒体生产」系列课程第一讲:概念、原理和基本使用,由阿里云视频云媒体服务技术负责人分享智能媒体生产的领域与定位、构架与服务层次、基本概念与技术原理,以及如何一站式…
-
Maqsam 推出突破性的阿拉伯语语音识别技术
2023 年 2 月 7 日—— 总部位于中东和北非的领先云通信公司 Maqsam 在阿拉伯语自动语音识别 (ASR) 领域取得了重大的全球突破;也称为语音转文本 (STT)。在准…
-
欧洲首创的点播和直播电视指南
TVProfil TV 应用程序已经发展成为欧洲第一个混合实时线性广播和流媒体电视指南,其中包含所有流行体育联盟的现场比分。 它的下载量已超过 100 万次,可在 20 多个国家/…
-
中国及31省市元宇宙产业政策汇总及解读(全)
从中国元宇宙相关的发展规划来看,十三五规划之前,我国主要以发展元宇宙相关技术为主,进行组织实施搜索引擎、虚拟现实、云计算平台、数字版权等系统研发。十三五期间,政策上加快支持元宇宙相…
-
视频流中YUV420图像拼接怎么实现
在视频监控或者视频会议中最常用的就是图像拼接和字符叠加,25FPS的视频流,如果每隔40MS就从各个通道中取一幅图像来合成,则可以看到一个实时的合成视频。合成的过程也就是原始图像的…
-
M3U8-TS文件合并为MP4文件
M3U8文件是一个索引文件,里面包好N个TS的分片文件,组成一个视频文件。目前在直播和点播中应用非常广泛。我们下载一个M3U8视频文件,就是下载了N个TS分片文件,导致我们手机相册…
-
Antel 测试适用于 5G 架构的 VMware 电信云平台
总部位于乌拉圭的移动运营商 Antel 宣布,它现在正与 VMware 合作,对 VMware Telco Cloud Platform 进行用例驱动的试验,以支持概念验证 (Po…
-
2023年元宇宙与Web3值得关注的发展机遇
2022年,众多企业加入了元宇宙和Web3的浪潮,在此方向布局投入;但与此同时,在通胀与疫情、通胀、地缘政治背景下,海外科技巨头和国内相关企业也承受着巨大压力。如何刺激有效需求,降…
-
无线音频产品在2023年的3大发展趋势预测
近几年来,无线音频产品炙手可热。从最早的蓝牙立体声到目前最先进的主动降噪 (ANC)、蓝牙多点和无线充电,产品及其底层技术一直在不断进步。2023年无线音频产品技术还有哪些趋势呢?…
-
谷歌正推动 ChromeOS 的新联络中心创新
当远程工作在 2020 年兴起时,在美国许多联络中心开始为员工提供 Chromebook 以供其工作。 为什么?因为 Chromebook 对联络中心有很多优势,包括价格、部署速度…
-
冷知识 | 为什么OpenCV使用BGR颜色格式?
OpenCV 的早期开发人员之所以选择 BGR 颜色格式,是因为当时 BGR 颜色格式在相机制造商和软件提供商中很流行。BGR 是出于历史原因做出的选择,现在我们必须接受它。
-
字节跳动公益平台上线“DOU爱公益日”,以短视频和直播连接善意
在第七个中华慈善日来临之际,多家互联网平台发起公益日活动。继腾讯“99公益日”、阿里巴巴“95公益周”后,字节跳动公益平台首次发起“DOU爱公益日”主题活动,提出“开心做好事”的公…
-
声频(音频)系统简介
声频系统的组成 声频系统(Audio System)也称为音响系统(Sound System)、音频系统、电声系统。工业界称音频系统比较多,但学术界还是称声频系统更准确,因为涉及到…
-
音频新方案带给VR更“真实”的音频体验
作为约克大学XR Stories项目的一部分,专家们提出了一种新的声音方法来开发VR环境,该方法基于人们如何从现实世界接收图像和声音,最终改善用户体验并降低VR眩晕的风险。 家用V…
-
如何打造更具吸引力的元宇宙空间?
“如果元宇宙技术从2022年开始被采用,到2031年,元宇宙技术将为全球GDP贡献3.01万亿美元,其中三分之一(1.04万亿美元)来自亚太地区。” 近日,一份由Meta委托国际经…
-
元宇宙如何获得更好的音频体验?Meta开放三种新型AI驱动的声学模型
Meta AI与德克萨斯大学合作,开源了三种基于视听感知的新模型,可以帮助改善AR/VR体验。此次发布代表着Meta向元宇宙方向进一步转化。 第一个模型,视觉声学匹配模型(AViT…
-
从技术全景到场景实战,透析「窄带高清」的演进突破
随着5G时代的到来,互联网短视频、电影电视剧、电商直播、游戏直播、视频会议等音视频业务呈井喷式发展。 作为通用云端转码平台,阿里云视频云的窄带高清需要处理海量、不同质量的视频。对于…