即构科技数智人PaaS服务上线,简单几步即可快速集成数智人云端API

2023年10月31日,即构发布即构数智人 PaaS 服务。支持开发者通过数智人 PaaS 服务服务端 API,实现查询数智人资产、合成数智人视频(文件/流式)、合成语音、生成 AI 文案等多种能力。

即构数智人 PaaS 服务,基于数智人底层 AI 能力,通过云端接口,助力开发者生成数智人文件视频或创建音视频流,灵活适用各式数智人场景,如短视频创作、直播等。

注意:如需使用本产品创建直播并推流,请搭配 实时音视频

数智人产品优势

快速集成

简单调用服务端 API,即可快速实现功能,开发者无需部署运维服务端,大幅度降低开发成本,助力产品快速上线。

丰富的数智人配置

支持通过格式、分辨率、音色、形象等多维度配置接口,灵活应用于各类应用场景。

创作方式灵活

支持生成异步视频文件、实时音视频流,满足短视频/直播应用场景。

数智应用场景

场景描述
短视频制作服务端 API 接口提供数智人短视频制作所需要的包括背景、形象、音色等配置,支持不同视频格式,不同清晰度,异步生成数智人视频文件。
数智人直播开发者调用服务端 API 创建数智人视频流任务,用文本或语音驱动数智人,以音视频实时流的形式推流至 ZEGO 实时音视频云(RTC),客户端拉流收看直播画面,实现数智人直播。
互动问答开发者调用服务端 API 创建数智人视频流任务,开发者获取到终端用户提问内容后,用文本或语音驱动数智人回答,以音视频实时流的形式推流至 ZEGO 实时音视频云(RTC),客户端拉流获取数智人回复画面,实现数智人互动。

数智功能特性

主要功能功能描述
数智人资产查询开发者调用服务端 API 查询对应可用的公共/定制的数智人形象、音色等。
支持异步/实时的视频合成方式支持以文件或音视频流的形式生成视频。
支持不同流媒体格式与清晰度封装格式:MP4、WebM(支持 Alpha 透明通道)。
视频清晰度:1080P、2K。
语音合成支持文本转语音能力,支持 SSML标记语言
语言大模型支持问题输入,通过语言大模型输出 AI 文案

本文为原创稿件,版权归作者所有,如需转载,请注明出处:https://www.nxrte.com/jishu/36837.html

(0)

相关推荐

发表回复

登录后才能评论