技术文章
-
OpenICL: 用于上下文学习的开源框架
摘要 近些年来,上下文学习((In-context Learning, ICL)日益受到越来越多的关注,并成为大型语言模式(LLM)评估的新范例。与传统的微调方法不同,ICL采用预…
-
浅谈活动场景下的图算法在反作弊应用
随着反作弊与作弊黑产对抗愈发激烈,作弊手段日新月异,我们也不断尝试新的方法解决新的作弊问题。本文主要介绍在活动场景下,应用图算法解决社团类型作弊问题。图模型不仅能够同时融入图的拓扑…
-
云渲染任务智能算力调度策略研究
摘要:近年来中国云渲染需求呈爆发态势,然而大量社会算力仍未得到充分利用。针对以上问题,提出基于算力网络的云渲染任务智能算力调度策略,充分调度各类算力资源,运行云渲染任务。该调度策略…
-
使用 Spring Boot 和 grpc-server-spring-boot-starter 开发一个 gRPC 服务
大多数使用 REST 的系统间通信组件在 JSON 中序列化它们的有效负载。截至目前,JSON 缺乏广泛使用的模式验证标准:JSON Schema并不广泛。标准模式验证允许将验证委…
-
KBS 2022|基于多视角子空间学习的 RGB-D 情绪识别
简介:多视角子空间学习(Multiview subspace learning, MSL)已广泛应用于各种实际应用,包括情绪识别。尽管 MSL 取得许多进展,仍有两个挑战需要解决。…
-
Varjo专利分享注视点渲染图像相关的编解码方法
Varjo是一家专注于研发人眼分辨率头显的VR硬件厂商。为了实现这个目标,他们关注的重点技术是利用人眼特性的注视点渲染。作为说明,对于人类的视觉系统,小小的中央凹为视场中心提供了最…
-
基于网格的量子计算机化学模拟方法
在《科学进展》杂志封面上刊登的一篇新报告中,Hans Hon Sang Chan和牛津大学材料、化学和量子光子学研究团队生成了具有多达36个量子位的精确模拟量子计算机,以探索资源节…
-
全光算力网络关键技术及建设策略研究
摘 要:全光传送网络作为新基建和算力网络的坚实底座,需要从带宽驱动的管道网络向面向泛在算力业务的全光算力网络演进。首先介绍了算力网络发展演进趋势及国内运营商算力网络布局现状,随后对…
-
FFmpeg 视频拼接的案例分析
海外业务有视频拼接的需求,简单的说就是将两个视频拼接在一起形成新的视频(原视频+EC视频)。 调研后发现,视频拼接有如下方式: 一:单独使用ffmpeg的分离器:concat (解…
-
FFmpeg 入门学习 01–打开视频文件
背景 FFmpeg 是音视频开发中最常用到的开源软件,许多商业软件都以 FFmpeg 为基础进行开发定制。由于近期工作中的项目涉及到了音视频相关开发,本系列文章用来整理和记录在使用…
-
语音识别资料汇总:常见库和特征对比
语音识别基础 语音数据是一种时间序列数据,它记录了声音在时间轴上的变化。 通常通过麦克风收集,每个时刻的声音信号被采样成数字形式,形成一个时间序列。 语音数据通常需要进行…
-
使用 PHP 和 Python 进行 JSON 的编解码
JSON是一种基于文本的数据格式,通常用于在系统之间存储或传输数据对象。JSON 由名称/值对的集合和有序的值列表组成。 使用 PHP 进行 JSON 编码和解码 json_enc…
-
使用 OpenCV 的 YOLOv4 目标检测
YOLO(You Only Look Once)是一种对象检测算法,可以近乎实时地检测图像中的对象。YOLOv4 是 YOLO 的第 4 版,于 2020 年 4 月推出。 本教程…
-
使用 OpenCV 从IP摄像机捕获 RTSP 流
大多数 IP 摄像机都支持实时流协议 (RTSP) 来控制音频和视频流。本教程提供了如何使用 OpenCV 和 Python 从 IP 摄像机捕获 RTSP 流的示例。 OpenC…
-
WebRTC加密和安全(下)
在上文WebRTC加密和安全(上)中,我们介绍了WebRTC和WebRTC安全漏洞和注意事项,本集中我们接着讲WebRTC安全的类型。 WebRTC安全的类型 WebRTC是一种复…
-
WebRTC加密和安全(上)
WebRTC不仅仅是一个协议。它是流技术的集合,包括协议、标准和三个JavaScript API。其中包括用户数据报协议(UDP)。此连接协议与其对应协议传输控制协议 (TCP) …
-
混合时域对齐及局部双向循环的视频去模糊
本文介绍上海交通大学宋利教授带领的 medialab 实验室最新发表在ACM TOMM的工作,基于混合时域对齐及局部双向循环的视频去模糊方法。在该论文中,我们提出了一个用于视频去模…
-
在树莓派上安装 FFmpeg
FFmpeg是用于处理视频和音频文件的开源工具集合。它允许将视频和音频文件从一种格式转换为另一种格式、调整视频大小、流式传输音频和视频,以及对媒体文件执行各种其他操作。 本教程介绍…
-
5G语音方案的三个阶段
5G时代,实时通信仍然是不可或缺的基本业务能力。5G发展至今,已经从基础建设期进入了加速发展期,那么5G语音现在什么样了? 在5G SA架构下,5G语音方案包含三个阶段: EPS …
-
在 Android 上使用 LibVLC 显示来自网络摄像机的 RTSP 流
LibVLC for Android是一个允许在 Android 应用程序中嵌入 VLC 引擎的库。本教程提供了如何在 Android 应用程序上使用 LibVLC 显示来自 IP…