在本系列文章的第一部分,我们简要讨论了生成式人工智能的工作原理和 LLM 的训练方法。在本文(第 2 部分)中,我们将回顾 Zoom、思科、微软和谷歌提供的人工智能助手的功能。我们的主要目的是帮助已经选择了 UCaaS 平台(或者正在选择过程中)的用户更好地了解和利用他们可以访问的人工智能功能。
前言
我们认识到,任何时候只要我们把属性放到图表的行中,把对这些属性的评论放到列中,我们就会引来比较。对它们进行比较是公平的,但在 UCaaS 平台中的 Gen AI 方面,有许多重要因素需要牢记:
- 每个平台的可用功能都在快速变化。虽然我们尽了一切努力确保截至 2024 年 3 月 27 日的信息正确无误,但您现在阅读的是 2024 年 3 月 27 日之后的某个日期的信息,因此,某些细节可能已经发生了变化(尽管我们认为供应商的整体理念和定位在未来几年内都将保持不变)。
- 公布的功能不一定是可用的功能。有些供应商的功能在发布时就已经可用,而有些供应商的功能则在发布几个月后才可用。我们的讨论基于可供我们测试的功能。在相关情况下,我们会注明 “已公布 “或 “预览中 “的功能,因为在这些情况下,我们无法对其进行测试。
- 在使用桌面客户端、网络客户端或移动客户端时,这些供应商的 Gen AI 功能可能会有所不同。为简单起见,如果某项功能在任何客户端中都可用,我们就将其包括在内。通常情况下,桌面客户端提供的功能最多。
- 在谈及微软 Copilot 时,必须承认微软 Copilot 有十多种不同的产品。我们的分析专门针对微软 365(M365)的 Copilot;同样,谷歌也有不同版本的 Gemini。
需要强调的是,我们的目的并不是建议某个平台比另一个平台更好,而是帮助您了解贵组织已选择(或可能选择)的平台上的可用功能。
整体定位
在探讨详细功能之前,我们有必要了解一下解决方案在价格和整体功能方面的比较情况。在下图中,纵轴代表价格,横轴代表所提供的 UCaaS 功能范围。
由于 Microsoft Copilot for M365 可在多个 Office 应用程序(Word、PowerPoint、Excel、Planner、OneNote 等)中使用,而且还可在 Teams 中使用,因此我们认为它具有最广泛的功能集。不过,这些功能的费用为每位用户每月 30 美元(需要 12 个月的使用承诺)。Google Gemini for Workplace 的价格也是每个用户每月 30 美元,但我们发现,在我们进行分析时,Gemini 的功能集不如其他解决方案。尽管如此,谷歌已宣布将在未来几个月内推出一系列功能。
用于 Webex 的思科人工智能助理和 Zoom 的人工智能伴侣都是免费提供给授权用户的,而且这两种解决方案都提供了我们认为引人注目的功能。Zoom 和思科都讨论了它们的人工智能伴侣/助手将在未来几个月内推出的新功能。
详细功能
在牢记上述注意事项的前提下,以下图表代表了我们对不同 UCaaS 平台当前可用核心人工智能功能的最大努力。这些图表的早期版本已在 Enterprise Connect 之前与供应商共享,他们的意见和反馈已纳入以下图表的最终版本。
红色矩形内的项目代表 “幕后 “人工智能功能,其余项目主要基于使用 LLM 的生成式人工智能。
作者认识到,随着各种 UCaaS 平台不断增加新功能,上述图表将会过时。我们欢迎社会各界提出意见、反馈和信息更新。
用例示例:会议摘要
会议摘要是会议期间讨论要点的简明概述。它们是根据会议期间捕获的语音到文本记录生成的。UCaaS 产品使用 LLM 分析记录,并提取最重要的信息、行动、决策和后续项目。这样,与会者就能更轻松地回忆讨论要点,跟踪行动项目,并与其他不在场的人分享成果。
一些 UCaaS 产品提供在会议期间和会后查询会议记录的功能。用户可以询问有关会议的具体问题,包括会议的总体情况、是否有未解决的问题、冲突或分歧领域等。如果用户参加会议的时间较晚,他们可以利用这一功能快速了解已讨论内容的摘要。
我们认为,对会议进行总结并提出与会议记录相关的问题是一种高价值的功能。因此,值得对各种实现方式的优缺点进行分析。
Zoom 会议摘要
Zoom AI Companion 会议摘要提供会议副本、基于文本的摘要,并可将会议记录分为章节摘要。它还能创建下一步和/或行动项目,并尝试提供会议要点(视频短片段)。
还有一种辅导功能,可以帮助人们了解自己在会议中说了多少话、在谈话中使用填充词的频率、语速有多快等等,这对用户提高会议演讲技巧很有价值。
最后,Zoom 会议摘要可以编辑,因此会议主持人(或指定的与会者)可以在将摘要发送给其他人之前对其进行编辑。我们认为,编辑人工智能生成的会议摘要和笔记的功能非常重要。
我们很欣赏 Zoom 将其人工智能伴侣集成到产品中的方式:它给人的感觉是经过深思熟虑的,而且始终如一。我们唯一真正不满的是,希望 Zoom 能在会议摘要/笔记界面上标注一些 “人工智能生成内容 “的提示。该公司确实会提醒用户查看人工智能生成的内容,但这种提醒是可以关闭的。我们不认为在 Gen AI 尚处于起步阶段时关闭这一提醒功能是正确的做法。
微软会议摘要
Microsoft 会议摘要通过两种不同的机制提供: Copilot for Microsoft 365 和 Teams Premium 智能会议总结。价格更高的 Copilot for M365 许可证包含智能会议总结功能。
Teams 会议摘要包括 Gen AI 会议笔记和行动项目。对于使用智能会议回顾功能的与会者,每次提到他们的名字都会被跟踪,他们可以快速跳转到录音中提到他们名字的部分。
Copilot 可创建核心主题和视频章节列表,并显示谁在何时发言。
我们喜欢微软在会议摘要屏幕上清晰标注人工智能生成的内容。我们还喜欢当你使用复制按钮复制人工智能生成的文本时,会出现 “由 Copilot 生成。请务必检查准确性。”这样的提醒。
微软提供了在会议期间和会后使用 Copilot 查询会议记录的功能。例如,您可以要求 Copilot “按主题列出不同观点”。在会议结束后提出有关会议的问题是微软目前独有的功能。
我们担心的是,微软不允许编辑人工智能生成的会议记录或行动项目,尤其是这些可能包含错误的会议工件仍可供受邀参加会议的其他人使用。我们建议微软尽快纠正这一缺陷。
虽然在主会议摘要屏幕上很容易搜索到记录誊本,但编辑记录誊本并不直观。编辑需要用户点击 “Open in Stream “按钮。如果有人想编辑自动生成的章节,也需要这样做。
Webex 会议摘要
Cisco Webex AI 助手会议摘要提供了一份会议副本,以及人工智能生成的会议摘要、行动项目和自动创建的会议章节。
Webex 的一个有趣功能是,在生成会议摘要和行动项目之前,您可以审阅和编辑记录稿;这有可能让您修正任何语音到文本的错误,从而使人工智能生成的内容正确无误。
Webex 还允许您编辑所有的 Gen AI 元素(笔记、记录誊本、行动项目、摘要等)。我们非常喜欢的一个功能是,当人工智能生成的内容被修改时,修改文本的用户名会被捕获并显示出来。(例如,在下面的 Webex 屏幕图像中,会议摘要显示 “由 Kevin Kieller 编辑”)。
谷歌会议摘要
Google Gemini 会议摘要在测试时一般不可用,因此我们无法测试此功能。
用例示例:提炼文本
例如,Gen AI 可以改变现有文本的语气,使其听起来更专业或更随意。还可以要求它延长句子或段落的长度,或使其更加简洁。
虽然我们认为完善聊天信息和电子邮件文本的功能对大多数用户来说价值不高,但研究一下不同的 UCaaS 解决方案对这一功能的不同实现方式还是很有意义的。下面的分析旨在说明在四种 UCaaS 解决方案中使用人工智能生成功能时的各种选择和方法。
Webex:提炼文本
Webex 为用户提供了许多精炼文本的选项。用户可以选择多个切换按钮(改进、修正错误、格式化、缩短、加长),然后可以选择形式(随意、中性、正式),然后可以选择语气(自信、同情、开朗等)。这可能会给用户带来过多的选择,而且 Webex 缺乏其他 UCaaS 平台所提供的能力,即要求 Gen AI 自定义文体,如 “把这写成一首押韵的诗”。
Zoom 提炼文本
Zoom 的整体用户界面理念以简洁为重点,”refine text”界面就体现了这一点,该界面还结合了翻译文本的功能。
Zoom 为用户提供了一些按钮,可将所选文本变长或变短,或将语气改为一些特定的风格:正式、非正式、友好、有说服力、幽默、讽刺、严肃、俏皮。不过,您也可以指定任何其他风格,例如,在 “告诉 AI 助手…… “文本框中输入提示语 “让它听起来像海盗”。
插入或替换现有文本的功能非常有用。
Microsoft Copilot 提炼文本
微软提供了一个简单明了的界面来完善现有文本。用户可以调整文本,使其更简洁、更长、更随意、更专业、更自信或更热情。用户还可以输入任何自定义提示,这样他们就可以要求把文字写得 “听起来像莎士比亚”。
在我们的测试中,Copilot 在保留格式方面做得最好,包括原文中嵌入的任何链接或@注释。
Google Gemini 提炼文本
Google Gemini 提供了一个简单的界面,用户可以轻松调整语气(正式或随意)、总结、概括、详细说明、缩短或重新措辞。您还可以提供自定义提示。
在我们的测试中,Gemini 的详细说明功能确实能从简短的输入短语中生成大量的输出文本。Gemini 还为精炼文本提供了替换和插入选项,非常实用。
用例总结
纵观 UCaaS 供应商的会议摘要和文本细化用例,我们可以清楚地看到,相同功能的实现方式可能大相径庭。这意味着,即使两家供应商提供了相同的功能,在特定情况下的效果也可能大相径庭。我们还希望所有供应商的功能都能快速发展和改进。
某些 Gen AI 功能的配置和使用,尤其是与会议摘要相关的功能,可能会比较复杂,IT 专业人员和最终用户都可能需要接受培训。IT 专家需要对供应商的解决方案进行配置,以便启用正确的选项,而最终用户则需要了解启用人工智能摘要的要求、有哪些可用选项以及这些选项的局限性。
我们的结论是,为了简化 UCaaS Gen AI 功能的访问并提高其效果,所有供应商都还有很多工作要做。
作者:Brent Kelly 和 Kevin Kieller
译自:https://www.nojitter.com/ai-automation/testing-gen-ai-use-cases-ucaas-platforms-part-2
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/48319.html