按时间归档:2023年
-
用于实时辐射场渲染的 3D Gaussian Splatting | SIGGRAPH 2023
网格和点是最常见的可以用于基于 GPU/CUDA 快速光栅化的显式三维场景表征方式。而神经辐射场基于 MLP 使用体渲染对捕捉的场景化进行自由视角合成。而提升辐射场效率的方案目前多…
-
即构科技携手安天、数美发布一站式内容安全审核与预警方案
10月9日,即构科技牵手安全解决方案领导者安天移动安全、数美科技,正式发布一站式内容安全审核与预警方案,帮助客户识别直播平台、语音聊天室等场景中的不良信息,更快、更准确地进行风险预…
-
云化XR和沉浸式全息交互技术的探索与思考
编者按:计算机图形与仿真技术的发展为人类带来了众多的沉浸式技术。虚拟现实(VR)、增强现实(AR)、混合现实(MR)等技术通过不同程度数字信息与现实环境的融合,为用户带来了全新体验…
-
单通道语音唤醒与语音增强结合时的性能变化
单通道语音唤醒常应用于TWS耳机、智能手表等边缘设备上,作为语音助手的“守门员”。各信噪比下的唤醒率、每日误唤醒、唤醒延迟、模型参/算量是衡量语音唤醒算法性能的若干关键指标。低信噪…
-
怎样查看macOS支持的硬件编解码器信息
已知macOS支持H.264和H.265编解码器,但是像VP9在某个设备上是否支持未知。很奇怪macOS上找不到一个现成的工具,能够查看支持哪些视频编解码格式。于是我翻了一通App…
-
共建国家级科创载体,国创中心“超高清全媒体开放实验室”向咪咕正式授牌!
10月8日,杭州第19届亚运会落幕之际,由中国移动咪咕、北京大学、AVS产业联盟、中国移动浙江公司联合主办,以“数智观亚运,视界谱新篇”为主题的大视频子链技术创新论坛在杭州隆重举行…
-
5G高密重载场景ToB/ToC组网策略研究 | 王蕾、曾伟等
摘要:为满足冬奥高密重载组网需求,利用国家体育场环境实施空频多维度5G立体组网、精细容量规划、精准区域覆盖,并在全场景应用分布式大规模天线技术、端到端5G切片技术、载波聚合、超级上…
-
CPaaS是什么意思?CPaaS的工作原理、功能、优势和用例
在数字连接时代,通信平台即服务(CPaaS)成为现代通信的变革力量。这种以云计算解决方案为核心的动态技术正在重塑企业和组织与受众的联系方式。 随着对无缝、实时通信的需求不断增强,C…
-
拉斯维加斯球使虚拟现实成为一种全身体验
我今年获得的最佳虚拟现实体验并不是使用500美元的Quest 3或3,500美元的Apple VisionPro,而且它甚至不需要头显。当然,它花费了23亿美元。但它配有来自标志性…
-
Alpine Linux 容器中的 Sipexer
Sipexer 是一款非常不错的命令行 SIP 客户端,由 Kamailio 的主要作者和维护者 Daniel-Constantin Mierla 编写。虽然我不知道用它连接语音信…
-
通过MPEG-I标准在客户端设备上高效传输和渲染新兴体积视频体验 | IBC2023论文
IBC2023:本技术论文介绍了由 InterDigital 和 Philips 联合开发的平台的实时实现,该平台展示了利用 MPEG 体积 (MPEG-I V3C) 和 2D 视…
-
Kamailio 有状态代理与无状态代理
人们通常会讨论 SIP 代理是 “有状态 “还是 “无状态 “运行,但这些概念之间的区别可能很难把握。RFC3261 中当然有详细说…
-
自适应流媒体智能传输优化研究
编者按:在视频流量爆发式增长的当下,面对多用户多场景的网络挑战,如何降低卡顿、提升用户体验是流媒体传输研究的关键。LiveVideoStackCon 2023上海站邀请到了清华大学…
-
嵌入式音视频-存储录像实现方案mp4v2
最近需要将H264视频编码成MP4格式。研究了一下,一种方法是采用ffmpeg库,可以先将H264文件解码,再编码生成MP4文件,但这种方式效率较低,10M的视频可能需要几秒钟才能…
-
快手StreamLake“子弹时间”亮相亚运会 打造智慧观赛新体验
杭州第19届亚运会不仅是国际顶级体育盛会,更是一场精彩绝伦的中国科技盛宴。本届亚运会中,快手StreamLake与杭州电信深度合作,联合打造智慧观赛新体验,在击剑赛事的转播中,全面…
-
视频直播高延迟怎么解决(视频直播高延迟的原因)
视频直播高延迟指的是在实时互动中,由于网络传输、设备性能等因素,导致音视频数据在传输过程中的延迟过高,从而影响到用户的观看和体验。在音视频开发中,延迟一般指音频和视频的延迟。 具体…
-
在 NextJS 中用 ffmpeg 剪辑视频
FFmpeg 是一个由用于多媒体任务(如音频和视频转换以及视频修剪)的库组成的工具。为了在客户端实现视频修剪,将通过 FFmpeg.wasm 来使用 FFmpeg 软件包的二进制格…
-
Attend-and-Excite:基于注意力的文生图扩散模型语义指导 | SIGGRAPH 2023
最近文生图模型达到了一种前所未有的图片生成创造力。但是现在的SOTA扩散模型对文字描述的还原仍然不完美。经过对公开的稳定扩散模型的分析,认为它有严重的物体忽视问题。此外,发现模型还…
-
将 WebRTC 融入网络摄像头、安防、监控和视觉智能的美丽新世界
WebRTC 在监控和安全应用中占有一席之地。它不是这些行业的核心,但在许多部署中至关重要。 监控已成为我的心头大事。过去曾有一些供应商向我咨询,还有一些在使用 testRTC。还…
-
网络切换的终极指南和好处
网络切换是现代 VoIP 软电话提供的一项重要功能,可实现不同网络(如 WiFi 和蜂窝数据网络)之间呼叫的无缝切换。它允许软电话用户在办公室使用 WiFi 开始通话,并在走出办公…