通义听悟
-
通义3D-Speaker多说话人日志功能
说话人日志任务(Speaker Diarization)是指将音频划分为属于不同说话人的多个段落。其目标是确定音频中有多少个不同的说话人,并且识别出每个说话人在音频中的开始时间和结…
-
阿里云“通义听悟”新品上线!通义家族首个消费者端应用产品
6月1日,阿里云宣布通义家族系列产品新进展,聚焦音视频内容记录和理解分析的AI助手“通义听悟”正式上线,并面向公众开放公测。通义听悟内置了通义千问大模型的理解与摘要能力,结合阿里云…