企业语音技术现状:Enterprise Connect 预览

语音技术是一个范围广泛的话题,就像现在的许多其他事物一样,它正被人工智能所驱动和定义。可以说,人工智能已成为技术领域最被滥用的术语,但它仍在不断将语音技术提升到新的水平,远远超越了传统技术,而且所需的时间更短。这是我第六年在 Enterprise Connect 上对企业语音技术进行年度更新,自 2023 年以来的变化是我开始跟踪这一领域以来最深刻的。

我的更新一直侧重于语音技术的企业用例;这不仅是因为它与 Enterprise Connect 会议的主题一致,还因为这些用例不如联络中心的用例那么为人熟知,而联络中心正是大多数厂商关注的焦点。这种关注当然是有道理的:企业用例遍及整个组织,在人工智能的推动下,它们正在发挥比语音转录或虚拟助理更大的作用。

作为 UCaaS 和其他生产力工具一部分的语音技术应用仍将被广泛使用,但人工智能在企业中的语音用例也超越了 IT 目前的设想。这就是我将在 Enterprise Connect 会议上介绍的内容,以下是参加我们会议的预览。

2023 年以来的两大变化

TLA(即三个字母的缩写词)在人工智能领域无处不在–对话式人工智能(CAI)是 2022 年的产物,生成式人工智能(GAI)是 2023 年的产物,而大型语言模型(LLM)则是 2024 年的产物。所有这些都是人工智能故事中不可或缺的一部分,毫无疑问,2025 年还会有新的东西出现。我在之前的更新中回顾了 CAI 和 GAI 的重要性,虽然现在才 3 月份,但 2024 年的 LLM 似乎已经经历了多波演变。

人工智能带来的变化比任何人都要快,无论是对买方、卖方,还是对最终用户来说都是如此。在技术层面上,与去年相比,第一个变化是 LLM 是当前语音技术创新的驱动力,LLM 需要进入IT领导者的词典。(这篇文章我就不多说了,因为对于那些真正想了解更多信息的人来说,LLM 领域很快就会成为人工智能极客术语的兔子洞)。

2024 年的第二大变化是基于语言的人工智能技术变得多么先进。更具体地说,这涉及到人工智能的核心三要素,即语言,这是以语言为核心的人工智能分支,对语音技术有着最直接的影响。直到最近,前两者还为最常用的语音技术应用奠定了基础。

这些工具使人类和机器能够相互交流,为人工智能提供了桥梁,为工作场所带来了新形式的自动化和效率。然而,第三种形式很可能会成为最深刻的形式–自然语言生成。自然语言生成不是简单地转录或翻译语音,而是利用机器学习功能生成内容,这在短短几年前是完全无法想象的。这就是 Chat GPT 和其他 GAI 创新的由来,也是 2023 年以来的主流创新,但目前的这项技术只是未来技术的一个缩影。

当前应用状况

仅这两项变化就能轻松填满我们在 Enterprise Connect 上的会议,但它们只是为 IT 领导者需要如何考虑企业语音技术奠定了基础。核心用例现已成熟,并已融入所有主要的 UCaaS 平台–实时翻译和转录、自动会议摘要以及各种类型的虚拟助理,以帮助我们管理日程和工作流程。

最近的用例是基于 GAI(底层技术是 NLP)的,工人们现在用它来自动处理电子邮件等短篇书面交流,以及生成博客文章或报告等长篇内容。语音在所有这一切中扮演着两种角色,第一种是人类与机器互动的模式,让机器完成人类的指令。如果没有这一点,语音仍将完全以人类为基础,而人工智能则会转向不那么依赖人类输入的其他用例。

其次,由于大多数工作场所的交流都是以语音为基础的,企业现在正急于尽可能多地以数字形式捕捉语音,以便为其人工智能引擎(更准确地说,是 LLM)提供支持。他们在这方面走得越远,这些 GAI 输出就会越像人,从而使这些技术成为提高工作效率不可或缺的工具。

尽管人工智能取得了巨大进步,但就企业语音技术的现状而言,过去几年来情况变化不大。工人们仍在学习如何采用这些实时翻译和转录、自动会议摘要和各种虚拟助手。对于上面提到的所有例子,都会有持续的改进,而不是全新的应用,因此,IT 部门的期望应该是支持它们,帮助员工更自如地使用人工智能。这将意味着支持更广泛的语言和方言。对于 GAI 来说,这意味着对语言、上下文、意图等的理解将更加准确。- 这代表着人工智能的力量,即数据集越大,人工智能就越能不断改进。这些改进对于建立信任和采用人工智能至关重要,因为仍然存在许多挑战和盲点,可能会损害语音技术为企业带来的任何商业价值。

对 IT 领导者的影响

对于人工智能如何塑造企业中的语音技术,除了这些用例之外,还有更大的力量在起作用,我们将在会议中讨论这个更大的问题。

最重要的是,IT 部门需要为企业制定人工智能战略。这些技术的发展速度太快,潜在影响太大,因此不能采用修修补补、被动反应的方法进行管理。企业语音技术需要从更全面的角度来看待,将其视为人工智能可以提供新业务价值的多个用例之一。

例如,基于 UCaaS 的语音技术应用在提高工作效率方面的价值是毋庸置疑的,但同时也存在一些前景广阔的业务用例,如人力资源部门提高招聘效率、市场营销部门生成内容、法务部门监控合规性等。从更横向的角度来看,知识管理很可能成为语音技术最有价值的用例,因为这将惠及整个组织。

从战略意义到战术考虑,IT 部门还必须考虑到与人工智能相关的众多挑战–不仅仅是工作场所或联络中心的挑战,而是整个企业在语音技术方面的挑战。有些需求是 IT 以前不需要考虑的,但对于获得可持续的投资回报却至关重要。最典型的例子是用于建立知识库的语音输入的透明度、减少偏见、保护个人隐私、防止深度伪造的安全保障措施,以及防止剽窃、侵犯版权、错误信息等。

没有哪种技术是完美的,也没有哪种技术可以规避风险,但也许没有哪种技术能像人工智能一样显示出如此巨大的潜力。语音技术尤其是其中的关键一环,因为它跨越了人类与机器之间的鸿沟,毫无疑问,它们的未来将进一步交织在一起。未来正在快速到来,如果您喜欢这个预览,我想您一定会喜欢我们的会议,希望能在现场见到您。我将与来自 Cognigy、Omilia 和 RingCentral 的演讲者一起出席会议,您可以在这里查看其他详细信息。

作者:Jon Arnold
译自:https://www.nojitter.com/ai-speech-technologies/enterprise-connect-preview-state-enterprise-speech-tech

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/44821.html

(0)

相关推荐

发表回复

登录后才能评论