通过 AI 和加速计算推动 5G 时代的创新

电信行业在推动整个社会的数字化转型方面一直发挥着举足轻重的作用。一个多世纪以来,从固定通信到移动通信,该行业孵育了连接全人类的技术。随着 5G 时代的到来,电信行业会起到更多关键作用,例如为众多永久在线的终端用户和计算节点提供不受线缆限制、无处不在的高速数据连接。

作者:
Ronnie Vasishta,负责 NVIDA 电信业务和战略及电信在所有终端市场的策略
Soma Velayutham,NVIDIA 人工智能和 5G 总经理,负责推动 AI 在电信和 5G 无线通信中的应用

IHS Markit 预测,到 2035 年,5G 价值链将凭借其无处不在的移动连接性,在各个行业和企业市场产生超过 13 万亿美元的总产值(图 1)。GSMA 预测,到 2025 年,仅移动通信行业就将为全球经济贡献 4.9 万亿美元(约占全球 GDP 的 5%)。

电信行业和整个社会能够连续取得成功并不是一件理所当然的事情。从历史上看,电信行业的大部分成功可以归功于该行业一直通过技术、标准以及经济和政策创新解决重大挑战。这个优良传统将一直保持到 2023 年及之后,电信公司将与其他新旧利益相关方协作,共同解决该行业所面临的重大挑战。

本文将介绍电信行业面临的五个重大挑战,并探讨 AI 赋能的电信公司如何利用 AI 和加速计算这两项基础技术来应对挑战和推动增长。最后,本文还将说明 NVIDIA 如何为电信行业提供 AI 和加速计算技术平台。


图片图 1  5G 将推动从交通到医疗等关键行业的万亿级经济增长

电信行业所面临的五大挑战

对于电信公司所面临的首要挑战,整个电信行业以及各相关方之间观点不一,关注行业决策者所重视的问题,将对这一讨论有所帮助。本节将讨论电信公司在努力挖掘 5G 时代的行业机遇时所面临的五大挑战。AI 和加速计算为解决这些挑战打下了基础,具体而言,AI 可提供软件工具套件,加速计算能够提供硬件补充。

1.产生新的收入

电信公司所面临的一个基本挑战是如何从他们的光纤投资,尤其是 5G 投资中产生新的收入。5G 是该行业最耀眼的资产,并将在 2022 年至 2025 年间推动 6200 亿美元的移动通信行业资本支出。但行业对于 5G 所创造的价值的期望与其商业现状之间的差距越来越大,这在企业和个人缓慢的 5G 采用速度以及电信公司业务范围之外的云服务之间尤为明显。

简而言之,如果无法将 5G 转化为足够的利润,该行业的资本回报率(ROCE)只会变得越来越糟糕。英国通信管理局(Ofcom)指出,英国电信行业的平均 ROCE 在 2017 年至 2020 年期间有所下降。

解决这个变现问题需要双管齐下,同时挖掘个人和企业市场的潜力。在个人业务方面,直接或与合作伙伴一起销售光纤和 5G 体验(比如游戏、沉浸式娱乐和 AI 服务等)这一举措已逐渐成熟。

在企业业务方面,构建边缘计算、推出更多5G设备和更加重视满足业务需求等举措都在开始发挥作用。

2.改进客户体验

由于电信行业的固定资本支出、运营支出和频谱成本很高,且对规模经济有较强依赖,因此该行业的首要战略重点是获得新客户(或不失去现有客户)。在市场日渐成熟且人口趋向于低增长的背景下,最佳的客户体验不一定能赢得客户,但最差的客户体验肯定会失去很多客户,这已成为该行业公开的秘密。事实上,在 2022 年美国的一项调查中,Techsee 报告称电信行业的客户流失率为 46%,是所有被调查行业中最高的。

为了改善客户获取和流失管理,电信公司正在努力提供良好的客户体验,通过投资网络质量、AI 驱动的数据分析和用于客户互动的对话式 AI(例如虚拟形象和聊天机器人)增进他们与客户之间的关系。

3.降低运营的复杂性和成本

运营的复杂性是电信公司所面临的一项重大挑战。其对成本的影响会给电信公司带来巨大的经济压力。例如电信公司需要承担维护语音服务基础设施的义务,但与此同时电话业务所带来的收入增长日益减少。

电信公司正试图通过各种方法管理复杂性和提高运营效率,比如在网络层面采取网络参数实时优化、流量路由、故障预测和预防等措施。在运营层面采取的措施包括:

  • 优化遗留基础设施的管理,例如关闭 2G/3G 网络
  • 采用“云优先”策略
  • 运营的智能自动化,包括业务支持系统(BSS)和运营支持系统(OSS)。

此外,将自动化和 AI 应用于传统的人工解决方案同样至关重要。业务层面的相关措施包括重新培训并挽留能力合适的员工、管理能源采购(尤其是通过将可再生能源纳入到能源组合)以及在某些情况下通过剥离基础设施落实轻资产战略。

4.提高能源和安全恢复力

电信基础设施是受到政府严格监督的重大国家基础设施,因此政府高度重视它的恢复力。无论是加拿大、荷兰、韩国、英国,还是全世界的任何地方,电信基础设施的日常停机都会产生严重的政治和经济影响。能效(包括与可持续性有关的方面)和安全(包括网络安全和供应链多样性)是对电信基础设施恢复力的两个最大的威胁。

能源成本已成为电信公司众所周知的“房间里的大象”,在节能计划和可再生能源的多样化方面,电信公司亟待采取强有力的行动,约 80%的全球移动通信业正致力于减少温室气体排放。

同样,人们对网络安全的担忧也会影响到行业的活动(例如重视开放式 RAN 软硬件的分离)并推动了政府对电信设备采购的干预。

5.优化 RAN 的总运营成本

RAN 是目前移动网络中成本最高的部分,预计在 5G 时代将占到网络总运营成本(TCO)的 65%。过去,RAN 演进的主要目标是提高性能,而现在又多出了三个目标:

  • 通过可编程性提高灵活性并简化升级
  • 支持软硬件分离的开放式标准和接口,这被认为是RAN的未来发展趋势
  • 兼容一切工作的基础设施,可以与其他创造收入的AI工作负载共存于商用现成(COTS)硬件上

根据预测,预计到 2027 年 RAN 基站数量将增加近一倍,但现实是大多数 RAN 基站的平均利用率低于 25%。RAN 的重要战略意义将为实现 RAN 规划、部署、管理和变现方面的创新带来巨大的机会。
AI 和加速计算在这个过程中都可以发挥重要的作用。作为 5G/6G 物理层处理所必要的高性能计算的唯一途径,加速计算是优化 RAN 总运营成本的先决条件。

AI 赋能的电信公司

AI 和加速计算为 AI 赋能的电信公司提供了应对行业最大挑战的关键技术工具,NVIDIA 正在通过一套技术平台提供这些工具,目前已向电信公司提供的商业产品和解决方案以及仍在开发的产品共分为四种类型(图 2)。


图片图 2. NVIDIA 通过四种类型的产品支持 AI 赋能的电信公司

每种类型的产品(详见下文)都为 NVIDIA 合作伙伴和客户提供包括 NVIDIA 硬件和软件在内的套件并针对他们的个人需求进行定制。

  1. AI 赋能的边缘:主要是利用云和边缘 AI 推动新的利润增长。各种行业主导用例将推动计算机视觉、云游戏和物联网领域新工作负载的发展,并孵化出一个由 NVIDIA 认证电信合作伙伴组成的生态。
  2. AI 赋能的运营:主要是提高电信公司运营效率的解决方案,包括大数据工具和平台、人工智能运维(AIOps)以及 AI 客户体验工具。
  3. 加速网络:主要是通过结合加速/卸载与安全来提高能效和基础设施的现代化,包括通过 NFVI 实现的网络虚拟化、5G 工作负载的虚拟网络功能以及AI驱动的安全解决方案。
  4. AI 赋能的无线网络:主要是开发基于 NVIDIA Aerial SDK 的全栈式、软件定义、可编程和 GPU 加速的 5G vRAN,包括部署用于公共 5G 网络的 NVIDIA Aerial;将 AI 和 5G 组合到同一个企业计算平台上的 AI-on-5G;以及 6G 的长期研发与生态参与。

AI 如何改变电信行业的运营方式

AI 是当代最重要的技术力量,而它对电信行业的影响才刚刚开始。正如下文所述以及图 3 所示,AI 通过四种重要的方式影响电信行业并帮助电信公司挖掘机会和应对挑战。这些方式会影响利润(通过优化资本支出和运营支出来降低总运营成本)或收入(通过创造新的收入)。

1. 提高电信行业的运营效率

从网络部件到客户互动,AI 可通过每天采集的数TB数据以及由此产生的洞察来提高运营效率。这些洞察可用于预测性维护和容量规划、网络性能和用户体验的最大化以及抵御网络威胁和优化服务。

例如,AT&T 使用 NVIDIA RAPIDS 处理数万亿条记录,使各团队能够在节约成本的同时,优化网络并提高客户满意度。

2. 优化客户体验

无论是在网络,还是在零售一线和呼叫中心,AI 都能提供关于行为的可执行的洞察,改进客户体验。通过对话式 AI、虚拟形象、推荐系统等技术,AI 可以加强客户与语音座席之间的接触和个性化互动,包括支付提醒和促销优惠。

T-Mobile 正在使用 NVIDIA 对话式 AI 驱动其联络中心的实时语音-文本转换解决方案。Cloudera 正在使用大数据分析为电信公司的客户构建行为模型。


图片图 3. AI 改变电信价值链的四个途径

3. 建设更加有效的电信基础设施

AI 正通过多种方式使建设有效的基础设施变得更容易,包括:

  • 使用数字孪生网络改进 5G/6G 规划,例如,爱立信与 Heavy.AI 使用 NVIDIA Omniverse 打造数字孪生
  • 开通 5G 核心网中的服务,包括网络切片支持
  • 优化 RAN 的运行,以实现节能、移动通信管理和负载平衡
  • 通过与云端 RAN 架构动态共享计算资源来使用 RAN 基础设施
  • 通过零接触自动化改进 BSS(业务支撑系统)和 OSS(运营支持系统)

这些机会(尤其是对 RAN 产生的影响最大)推动了 3GPP、ORAN 等标准机构的活动与行动。

4. 为电信市场提供新的产品和服务

AI 所提供的实用功能使电信公司能够推出新的产品和服务。在个人用户层面,这些服务可能来自网络底层(例如可配置的 QoS);可能是 OTT 服务,如 AI 赋能的呼叫中心解决方案或高级视频会议;也可能通过辅助边缘/云设施提供(例如云游戏)。

在企业用户层面,AI 所提供的互联智能能力使工业用户能够引导交通流量、为自动驾驶车辆规划路线并提高工厂货物分拣和包装的智能化水平与效率。

各个行业都可以使用视频分析来改变运营方式并提供实时洞察。通过 AI 与 5G 实现的互联智能确保边缘 AI 可以克服移动性、速度、延迟、可靠性和安全方面的限制,提高本地化水平并遵守数据驻留规定。

加速计算如何改变电信行业的运营方式

加速计算是驱动电信行业 AI 的“引擎”,其使用并行处理技术加速 AI、数据分析、仿真模拟、可视化等应用方面的工作,将 CPU 与 GPU、DPU 等专用硬件组合在一个异构计算架构中以大幅加快AI的处理速度(图 4)。


图片图 4. 加速计算是驱动 AI 的“引擎”

加速计算的问世再次证明了“创新无止境”。这项技术出现在 PC 时代,用于支持图形和游戏的可视化。现在,它已成为云超级计算机的一个组成部分,为不同行业的企业提供可支持计算密集型工作负载的高性能计算(HPC)平台。

加速计算具体通过以下三种方式为创新和应对挑战提供硬件算力。

1. 将 GPU 计算基础设施用于 AI 工作负载

电信公司的大多数 AI 创新都是通过将 GPU 用于数据科学、可视化和游戏工作负载处理而实现的。电信公司正在其网络中部署 GPU 以支持电信工作负载和AI工作负载,例如,Verizon 已经为边缘 AI 服务创建了一个分布式 GPU 数据中心网络。

2. 通过 GPU 加速 RAN 工作负载

RAN,尤其是物理层(L1 – 第 1 层)是 5G 网络中计算密集度最高的部分。这是因为它涉及到一些最复杂的数学因素,如信道估计、调制、解调、前向纠错(FEC)等复杂的算法。电信行业在这一层所面临的一个主要挑战是在继续满足 L1 计算要求的同时,过渡到一个更加开放的软件定义架构。

凭借大规模的并行性和对 CUDA 编程的依赖,GPU 提供了一个既能满足 RAN 硬件要求,又能满足可编程性要求的强大解决方案。这项业界的重大创新实现了开放、可编程的全内联 L1 卸载,而无论是使用过去的专用 ASIC,还是最近的 FPGA 都无法实现这一点。

OpenAirInterface 软件联盟(OSA)已经展示了 5G vRAN 的 GPU 加速功能。按照这一轨迹,GPU 最终将被用于加速整个 5G RAN 堆栈和 5G 核心网功能。

3. 通过 DPU 优化 CPU 的使用

DPU(或其前身 SmartNIC)通过提供网络、安全和存储等标准功能帮助优化主机 CPU 的性能。例如前传时效性是一个重大的难题,而 NVIDIA 5G for 5T 解决方案利用硬件卸载实现了实时数据传输。

虽然 GPU 可以在 5G RAN 上提供全内联加速,但网络和安全等辅助基础设施工作负载组合仍需要通过 CPU 途径进行。DPU 非常适合卸载、加速和隔离这些基础设施任务,帮助提高性能、效率和安全性。在以这种方式用于 5G RAN 时,DPU 可以将所有 L1 eCPRI 数据带入 GPU,而且不需要在数据路径中使用 CPU。

结论

为了延续上个世纪颠覆性的连接技术革新,电信行业需要通过技术、经济和政策方面的创新来解决重大挑战。这篇文章介绍了可能影响电信公司整体财务业绩的五大挑战,AI 赋能的电信公司能够使用 AI 和加速计算来应对这些挑战。

NVIDIA 为电信公司提供了帮助其在网络和运营以及整个业务中采用 AI 和加速计算的关键技术平台。

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(1)

相关推荐

发表回复

登录后才能评论