人工智能转录仍需人工监督

为了简化会议体验,由人工智能驱动的生成式解决方案正作为嵌入式应用程序出现在会议和电话会议解决方案中,目的是提高用户的工作效率。

将 GenAI 纳入会议解决方案可引入各种旨在优化会议流程的功能,例如使用集成工具在会议中进行无缝记事和会议记录转录。

第三方助理可以对会议对话进行高级分析,并根据记录稿创建摘要和关键要点。

此外,会议期间对行动项目的实时提示可以提高工作效率,而白板的即时内容生成则基于文本提示。

虽然企业对这些功能表现出浓厚的兴趣,但在实施过程中也采取了审慎的态度。

特别是在第三方工具方面,出于管理和安全方面的考虑,企业正在谨慎行事,并正在开展试点项目,以确定这些功能的最佳使用案例,从而取得卓越的成果。

定义实时转录

在 Gartner 副总裁分析师 Ben Elliot 看来,这些功能仍然需要人工监督,因为它们可能无法理解说话者话语的上下文和一个人说话的确切方式。

他指出,自动实时转录的 “实时 “程度各不相同。

他说:”一个重要的问题是,高准确度往往需要一个完整的句子,但很多人不想等那么久。”因此,折中的办法就是自动同步转录,就像你在机场休息室的电视上看到的那样。

如果仔细观察,就会发现屏幕上的文字有时会在句子完成之前就被修改,因为句子或段落的某些后半部分澄清了句子前面词语的意图或含义。

Elliot 解释说:”我把即时实时和延迟实时区分开来,即时实时是指人类无法察觉的不到 200 毫秒的时间段,而延迟实时则可能长达数秒”。

Clari公司新产品集成主管 Will Patterson 说,从价值的角度来看,由于会议效率低下或个人参加的会议作用非常有限,知识工作者的生产力损失 “巨大”。

他说:”从技术角度来看,我们在过去一年中看到,LLM 确实非常适合摘要使用案例,因此整个生态系统中的参与者都推出了大量新功能。”我预计明年这种情况还会继续,但会超越基本的总结功能,允许用户定义他们希望机器人分析的更具体的主题和提示”。

他指出,在任何对话记录用例中,都存在记录同意的问题–当引入多个机器人代表多方加入的可能性时,这个问题就变得更加复杂了。

“作为会议参与者,我怎么知道我的数据会去哪里,谁会有权限访问这些数据?”帕特森问道。

Elliot 解释说,网络会议提供商可以通过管理录音同意权的基础设施来解决这个问题。

同时,会议机器人的创建者需要考虑如何披露每个机器人的所有者/意图,并让会议参与者了解和控制他们的数据在录制前、录制中和录制后的使用情况。

Elliot 说:”最终用户将对机器人代表他们进行的总结拥有更多的控制权。”现在,重点是有用但通用的摘要”。

生产力的可能性激发员工的热情

GP 首席产品和战略官 Nat Natarajan 表示,人工智能对全球商业格局产生了深远影响。

该公司的 2023 年全球增长报告发现,超过十分之九 (93%) 的员工对人工智能在工作中的潜在用途感到兴奋,特别是在自动化任务 (46%) 和信息汇总 (39%) 方面。

Natarajan 指出,超过三分之一 (36%) 的受访者表示,由于跨时区协作和语言问题的复杂性,他们对加入采用全球招聘模式的公司犹豫不决。

“人工智能驱动的转录和摘要工具通过促进无缝沟通和协作提供了一种补救措施,”他说。“人们对人工智能工具的兴趣日益浓厚,对于构建和管理全球团队的组织来说特别有利。”

不断发展的技术拓宽了能力

总体而言,生成式人工智能对文本的处理方式产生了显着影响,而不是语音到文本(又名语音记录,又名 ASR)。

“我们最近看到的许多增强功能都与 GenAI 和法学硕士的附加值有关,而不是与语音转录过程本身有关,”他说。“在某些领域,GenAI 用于即时实时语音,但这些用例范围较窄。”

他指出了一些处理方言和口音的有趣解决方案。

“你可以将 Krisp.ai 视为一家在实时通话中进行实时口音本地化的公司的例子,”他解释道。在其他情况下,法学硕士可以针对特定方言进行调整。”

然而,它不是实时的,并且可能不准确,他补充说应该区分口音本地化和翻译。

“在某些情况下,口音本地化可以实时完成,但翻译仍然存在延迟,”他指出。

他预测,虽然即时实时语言翻译将会发生,但以这种实时速度进行口音本地化在技术上仍然具有挑战性。

“更好的会议总结将出现在会议中,”他说。“我预计随着时间的推移,这些将集成到我们所谓的‘复合人工智能’中,并可能与决策支持和代理助理技术相结合。”

Patterson 补充说,当用户和管理员可以指定他们希望机器人在任何给定会议上执行哪些任务时,就会解锁一系列用例。

“如果时间有限的领导者无法参加特定会议,他们可以快速编写一组提示,指定他们感兴趣的主题,并快速了解他们关心的事情,而不是观看冗长的电话会议记录——甚至获得他们需要跟进的项目的建议,”他解释道。

作者:Nathan Eddy
原文:https://www.nojitter.com/ai-speech-technologies/ai-generated-transcription-still-requires-human-oversight

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/40980.html

(0)

相关推荐

发表回复

登录后才能评论