-
PolyAI 开放其智能对话平台,使数百家企业复杂对话背后的技术能够惠及所有开发者
PolyAI,这款用于构建对话式企业的智能对话平台,现已向所有开发者开放其平台。前两个月免费,这项技术已为全球最苛刻的客户对话提供支持,覆盖 75 种语言和 25 个国家/地区,现…
-
为视频制定 XR 战略
XR 技术正变得越来越先进、更小巧、更便于佩戴,且价格也更加亲民。公众对此的兴趣日益浓厚,终端用户也越来越愿意尝试沉浸式体验。然而迄今为止,我们主要看到的还只是探索性尝试,而非战略…
-
AI 如何揭示传统客户通信基础设施的隐性成本
企业技术预算正在快速变化。AI 投资不断增长,客户体验转型计划日益受到董事会的关注,各组织都在大力投资以改善数字化互动、客户服务和运营响应能力。然而,在许多这样的组织内部,一个悄然…
-
Firefox 151 现已推出,支持文档画中画 API
Firefox 151 正式版二进制文件现已发布,这是 Mozilla 开源网络浏览器最新的月度更新。 虽然之前有消息称 Firefox 151 将内置 JPEG-XL 图像解码器…
-
VIVO、蚂蚁图形渲染面试回忆:PBO 解决了什么问题
照例,最近总结了星球小伙伴分享的图形渲染、动效岗位的面试问题,分享一些比较有代表性的。 1. OpenGL ES 与 Vulkan 的技术选型 如果项目是常规 UI、2D 动效、视…
-
火山引擎联合中科院声学所在 ICASSP 首届低资源音频编解码器挑战赛中取得佳绩
作为全球首届低资源音频编解码器专项赛事,ICASSP 2026 低资源音频编解码器比赛(2025 Low-Resource Audio Codec Challenge,LRAC C…
-
AI 语音克隆:背后的技术、研发者以及发展方向
AI 语音克隆过去需要花费数小时训练语音模型,在录音棚录制极其高质量的音频,并部署一支高水平的研究团队。而现在,即使是一些DIY工具也能在几分钟内,根据一小段录音复制出人声,其效果…
-
Android 语音房应用内最小化实现方案(含完整代码)
适用对象:已经实现语音房基础功能(房间、麦位、推拉流),想加上”最小化成悬浮窗、用户切到其他页面也能继续聊”这一体验的 Android 开发者。 一、为什么…
-
极简复盘:彻底解决 live555 RTSP 花屏、画面残缺、高延迟问题
live555+H.264 是嵌入式、监控场景轻量化 RTSP 服务的常用组合,但普遍存在花屏、画面残缺、秒级高延迟问题。本文精简梳理实战排障过程,给出可直接落地的极简修复方案与最…
-
Zoom Spaces 借助 agentic AI 开启了智能办公时代
Zoom 正在重新定义混合协作的未来,将现代办公环境打造为智能化空间,从而更好地支持员工的工作方式。这一变革的核心是 Zoom Spaces,它是 Zoom 基于 AI 的灵活办公…
-
Sinch 最新数据显示,74% 的企业已撤回 AI 代理
多年来,AI 行业一直专注于一个问题:如何让 AI 走出实验室,投入实际应用。 根据云通信供应商 Sinch 的最新研究,这场战役已基本告捷,但随之而来的是更严峻的挑战。 Sinc…
-
InterDigital Maps 计划通过专利和流媒体服务实现 10 亿美元的经常性收入
InterDigital表示,公司正朝着2030年实现年化经常性收入超过10亿美元的长期目标稳步迈进,其目标涵盖智能手机、消费电子/物联网以及流媒体/云服务三大领域。公司还计划届时…
-
基础设施建设放缓,电信行业重心转移
电信行业正面临一项重大挑战:在网络覆盖需求不断增长的同时,基础设施扩张速度却在放缓。过去十年,业内公司投入巨资扩建网络并部署5G技术。然而,这轮投资周期正逐渐接近尾声。 移动网络设…
-
意大利:传统电视衰落,流媒体点播服务再创新高
意大利通信监管局发布的《2025年观察报告》显示,意大利传统电视收视率持续下降。与2024年相比,黄金时段的平均日收视率下降了2.5%,全天平均收视率下降了2.8%。 2025年,…
-
FFmpeg 推出基于 Vulkan 的 Apple ProRes RAW 视频加速功能
去年,广受欢迎的开源多媒体库 FFmpeg引入了使用 Vulkan API 着色器加速 Apple ProRes 视频的功能。现在,FFmpeg 更进一步,支持基于 Vulkan …
-
Vulkan 1.4.352 引入了 VK_NV_cooperative_matrix_decode_vector 函数
Vulkan 1.4.352 于上周五发布,这是 Khronos API 的最新小版本更新。除了少数修复和澄清之外,此次更新还新增了一个扩展,即 NVIDIA 为协作矩阵解码向量支…
-
RTSP 到 WebRTC:如何通过编译 Chrome 引擎构建自定义视频代理
当 Kurento 无法胜任我们的摄像头负载时,我们从源代码编译了 Chromium 的 WebRTC库,并在大约十天内构建了自己的精简版 RTSP 到 WebRTC 桥接器。 标…
-
实时互动平台如何改变数字娱乐
过去几年,数字娱乐发生了翻天覆地的变化。观众不再满足于被动地消费内容,他们渴望参与其中,做出反应,影响结果,并与创作者或社群实时互动。这种转变改变了娱乐平台的构建方式、创作者与用户…
-
PipeWire 1.6.5 为 Pulse 服务器带来额外的安全检查和加固修复
PipeWire 1.6.5 近日发布,这是 PipeWire 1.6 系列最新款的第五次维护更新。该开源软件用于在基于 Linux 的操作系统下处理音频和视频流。 在PipeWi…
-
8×8 AI Studio 新增 OpenAI 的 GPT Realtime 2,以支持生产环境中的语音代理
全球商业通信平台提供商 8×8 公司宣布,其 8×8 AI Studio 现已支持 OpenAI 最新的语音 AI 模式 GPT Realtime 2,为运行实…