技术文章
-
视频编辑场景下的文字模版技术方案
本文根据度咔剪辑APP文字模版开发实践,分享视频编辑场景下,静态文字模版渲染能力的技术方案。作为富文本渲染方案的父集,此技术方案可以扩展到其他需要复杂富文本渲染的场景下。 作者 |…
-
Android页面渲染效率优化实践
1. 车系页布局渲染现状 车系页是重要的车系信息页面,更新迭代多年,页面布局不断变化,xml布局文件越写越复杂。 获取车系页布局文件耗时: 结果如下: 2.卡顿的原因 2.1 A…
-
算力网络助推金融元宇宙的落地
摘要:后疫情时代,随着5G、AR/VR等技术的成熟以及人们工作和生活的转变,元宇宙逐渐走向产业化。银行保险等传统机构纷纷开始探索元宇宙下金融服务新模式。中国联通在自身能力基础上,着…
-
AIGC图像生成的原理综述与落地畅想
AIGC,这个当前的现象级词语。本文尝试从文生图的发展、对其当前主流的 Stable Diffusion 做一个综述。以下为实验按要求生成的不同场景、风格控制下的生成作品。 01 …
-
使用AI增强Graph网络
2021年12月,Semiotic成为Graph的第四个核心开发团队。虽然我们的章程是专注于利用研究为 Graph 带来新的人工智能 (AI) 和密码学功能,但在为协议做出贡献时,…
-
HNeRV:视频混合神经场 | CVPR 2023
内容摘要:chenhao 团队延续其 NeRV 相关工作,对 Position Encoding 的部分做了进一步的探索。在本文中,作者提出了一种混合神经表示视频(HNeRV),其…
-
短视频媒体处理系统应急响应自动化实践
每天在世界各地都有海量用户在短视频 App 上分享充满创意的视频或是生活中的精彩故事。 由于使用者所在的环境不可控(高铁、电梯等弱网环境),若直接播放原始画质的视频,可能导致观看影…
-
使用Python+OpenCV实现图像上轮廓绘制
在地形图中,你有没有注意到在山区和地形图中海拔高的区域周围画的线?这些线被称为地形等高线。它们给出了地形的高程剖面图。这些线条要么是手工绘制的,要么是电脑生成的。 在本文中,我们将…
-
智能家居云服务中API滥用风险 | 袁斌, 郑开民, 万俊, 邹德清, 金海
研究意义 近年来,智能家居领域迅速发展,涌现了大量平台为用户提供智能家居设备以及服务。为了方便用户灵活的定制智能家居的服务,越来越多的平台向用户和第三方开发人员开放应用程序接口(A…
-
如何使用 Python 和 OpenCV 构建增强现实
本文分享如何使用 Python 和 OpenCV 构建增强现实,作者:磐怼怼,来自公众号——深度学习与计算机视觉。 基于标记的 AR:这种类型的 AR 使用预定义的标记或图像来触发…
-
DINER: 深度感知的基于图像的神经辐射场
在过去几年中,虚拟和增强现实应用中数字人方面有着巨大的进步。特别是随着神经渲染和神经场景表征的引入,在新视图下渲染的3D数字人可以同时通过面部和身体跟踪进行控制。另一方面,许多研究…
-
WebRTC iOS 相机采集
WebRTC-iOS 的相机采集主要涉及到以下几个类:AVCaptureSession, RTCCameraVideoCapturer, RTCVideoFrame。 AVCapt…
-
高通专利提出多时隙SPS Occasions技术改善AR/VR数据传输
高通认为,现在的用户设备UE可以实现各种新应用,例如虚拟现实、增强现实和触觉反馈。由于它们具有与其他多媒体通信不同的traffic特性,所以有必要采用一种有效且灵活的方法来调度具有…
-
新型多阈值耦合双沟道InAlN/GaN HEMT改善跨导平坦度
研究意义 GaN基HEMTs具有众多优点,其在工作频率、输出功率方面已经得到长足的发展,可以满足通信系统对输出功率需求,使得系统具有更高水平的抵抗外界干扰能力以及更广阔的能量覆盖范…
-
什么是 Canny 边缘检测算法?
一、什么是 Canny 边缘检测 Canny 边缘检测器是一种多步算法,用于检测任何输入图像的边缘。它涉及在检测图像边缘时要遵循的以下步骤。 1. 使用高斯滤波器去除输入图像中的噪…
-
Opengl ES搭配FreeType进行文字渲染
自此已是我关于Opengl ES系列入门教程的第16篇文章了,虽然写的不咋的,文章产出量也不高,但是这个系列从2022年8月底开始持续到现在也坚持了比较久, 每一篇文章都是经过自己…
-
Netflix:探索理解媒体内容的平台
编者按:Netflix探索了许多通过机器学习提升视频生产效率的方式,比如对话搜索和视频搜索。但由于不同项目均独立开发,维护成本巨大。目前,Netflix正在着手解决这一问题。本文来…
-
音视频编解码—GIF介绍
GIF(Graphics Interchange Format) 一种主要用于动画和图形图像的图像格式。与 JPEG 格式类似,GIF 也是一种光栅图像格式。它本质上是一…
-
语音识别系列之基于脉冲神经网络的语音唤醒
语音唤醒(Keyword Spotting,KWS)是较为初级的语音识别任务,在2014年陈果果的工作[1]后,学界兴起大量研究,业界也获普遍应用,如智能家居(音箱、TV)、智能穿…
-
CVPR 2023|淘宝视频质量评价算法被顶会收录
近日,阿里巴巴大淘宝技术题为《MD-VQA: Multi-Dimensional Quality Assessment for UGC Live Videos》—— 适用于无参考视…