自2012年深度学习变革开始,历经十年黄金发展,AI圣火再次被引燃,由美国人工智能实验室OpenAI发布的聊天机器人ChatGPT引起全网轰动,与之相关的讨论层出不穷。微软联合创始人比尔·盖茨甚至表示,这项技术诞生的意义不亚于互联网或个人电脑的诞生。
从科技巨头到一二级资本市场,无一不对ChatGPT反应热烈。微软、谷歌、百度均在产品或战略上有所动作,资本市场上则引发国内多支概念股公司纷纷跟涨。ChatGPT备受追捧的核心原因是什么?我们将以什么样的姿态迎接ChatGPT,又将如何通过ChatGPT开花结果?
揭开ChatGPT真容,催生无限商业想象力
ChatGPT如此解释自己——这个名字是由两部分组成的:“Chat”和“GPT”。“Chat”是指该模型被训练用于进行聊天,而“GPT”是“Generative Pretrained Transformer”的缩写,表示这是一个预训练生成模型。因此,“ChatGPT”的意思是“预训练生成聊天模型”。
持续对话能力是ChatGPT的核心特点,它不仅可以理解复杂语句内容及上下文语境,快速给予用户一个清晰的、高质量的解答,并且连写小说、改代码、进行考试答题等复杂任务也不在话下。高质量的回答、高效获取信息的方式,以及上瘾式的交互体验,使得ChatGPT在C端迅速引爆。
但在偏娱乐化的技术尝鲜之外,ChatGPT所带来的产业价值想象更令人振奋。ChatGPT建立在由谷歌提出的神经网络架构Transformer基础之上,它的成功展示出了AI大模型的应用潜力,证明了Transformer模型并非陷入困境。
“它其实代表着从以前‘大炼模型’(各自研发专用小模型),到‘炼大模型’(研发超大规模通用智能模型)的一个范式转变。”盘古智库学术委员、美国国家工程院外籍院士、北京智源人工智能研究院理事长张宏江表示,大模型的发展很可能会改变信息产业的格局,改变以前作坊式AI开发模式,把AI应用带入基于互联网、云计算的大规模智能云阶段。
尽管过去几年人工智能领域碰到了一些技术瓶颈和商业化难题,但这种状况会随着大模型的发展和普及,尤其是通过大模型+微调的新技术开发范式,使人工智能的能力更好、更有效的应用到各个场景里,从而大大降低开发成本。张宏江同时强调,由于ChatGPT、AIGC等AI大模型技术不断成熟,未来会带来新的创业机会,包括更好的对话机器人、更好的机器翻译,更好的创作平台。
AI技术方法上的不断新突破正驱动全球AI产业进入加速发展阶段,叠加AI产业集群效应不断凸显,AI产业有望成为全球科技领域中期最具投资价值的产业赛道之一。“大算力+强算法”加持,大模型加速产业化进程
大模型是“大算力+强算法”结合的产物。中关村科金技术副总裁张杰认为,2023年会出现更多的大规模语言模型,它们将助推底层科技公司的模型即服务(Modelasa Service,MaaS)的商业模式。另外,对于处于中间层的科技公司而言,它们将围绕大模型所涌现出的复杂推理能力,挖掘出更多令人震撼的应用。
结合ChatGPT的底层技术逻辑,中信证券在报告中预测,中短期内ChatGPT产业化的方向主要在以下四类:
01 ChatGPT最适合直接落地的项目就是智能客服类的工作。
根据模型现有的完成度,在垂直行业针对性的做人工反馈训练,ChatGPT就可以落地为智能客服产品,在toC场景中率先应用。对比目前的智能客服,ChatGPT支撑的客服将在灵活性与人性化服务方面有显著的进步。
02 ChatGPT对于文字模态的AIGC应用具有重要意义,在归纳性的文字类工作中展现出了极其优异的表现。
中短期内ChatGPT能在办公辅助类工具中迅速落地,例如会议总结、文件翻译、例行报告等,提升办公效率并节省人力成本。
03 代码开发相关的工作更加规整也非常适合AI辅助生成。
ChatGPT在目前测试中表现出的代码生成能力相比于目前最成熟的AI代码补全工具Copilot更加灵活,但欠缺一些底层的稳定性。在进行针对性的优化后,基于新GPT模型的AI代码辅助工具也有望在中短期内落地。
04 图像生成领域成为了2022年下半年一级市场公司布局的热点,随着Dalle2的热度,在商稿方面用AI取代人类画手的思路基本明确。
GPT模型在图像生成领域目前效果略逊于扩散模型,但扩散模型可以利用ChatGPT生成较佳的Prompt,对于AIGC内容和日趋火热的艺术创作,提供强大的文字形态的动力。
以上这些应用场景有望在中短期内快速被产业化,以极低的成本表现出比此前更优越的性能。第三波AI浪潮经过十几年的发展后能否迎来拐点,除了在于AI算法、算力、数据“三驾马车”的同步突破,更重要的是商业化场景应用层面的繁荣,能否带来生产工具和生产方式的创新,推动社会进步和效益提升,让更多的人享受到AI技术红利。
2023三大关键技术布局,带动业务落地场景革新
大模型是AI发展的趋势和未来,考验行业认知深度和基于细分场景数据提供服务的小模型竞争格局必将受到冲击。如何深化对垂直行业的认知,真正把大模型融入到企业的创新业务流中,成为细分赛道里应用型厂商的必答题。
张杰表示,2023年中关村科金的研发重点将会放在三个方面:预训练对话语言模型、会话分析和话术流程挖掘。同时,关注AI技术的工程化、产品化问题。
预训练对话语言模型:大规模语言模型展示出了强大的能力,例如思维链(Chain of Thought),这些能力可能只存在于大模型中,而不存在于百亿参数以下的小模型中。在不远的未来,更大参数量级的多模态语言模型可能会带来复杂推理能力的大量涌现。技术层面的量变,可能会引发应用层的质变,今年中关村科金将仔细研究这些能力在企服场景下能提供什么、会改变什么,尤其是领域知识如何低成本地注入到大模型里,使其具备可控的领域知识的问答和推理能力。
会话分析:领域知识关注事实知识,会话分析关注行为意图。中关村科金仍将沿用基于真实数据的统计分析的方法,挖掘出对话中常见的行为模式,用于话轮设计。ChatGPT未来可能在内容营销、文章写作、绘画生成等方面产生巨大的商业价值,但其背后是语言模型,是语料上的条件概率,因此可能会出现生成文本不可控、多轮之间不可解释的情况,即大家常说的“一本正经的胡说八道”。企服场景下的对话任务所面临的问题不一样,不是在一个语料上学出一个条件概率的问题,而是要找出处于头部的小概率的最佳实践。
话术流程挖掘:在流程挖掘子领域,国外有些初创公司发展的很好,尤其是结合RPA,应用生产流程或审批流程的优化上,有很好的落地。但国内仍处于起步阶段。中关村科金研究的流程挖掘与之不同,主要处理对话语料,将对话序列做事件切分,然后从事件序列中找到话术流程的最佳实践、或者做流程一致性校验。
ChatGPT的优势是意图理解、上下文对话管理和高质量内容生成,其在C端用户和资本层面掀起的热潮,也使得对话式AI的商业价值进一步得到市场认可。
作为国内领先的对话式AI技术解决方案提供商,中关村科金围绕大模型所涌现出的复杂推理能力,自研的多项对话式AI产品已在企业服务赛道实现了众多应用落地,如:通过AI生成营销文案、7*24小时在线回答客户咨询的“得助智能客服系统”、模拟真实业务场景进行新员工沉浸式陪练的“得助智能陪练”、以数字人形态处理在线业务办理的“企业数字员工”。
对话式AI从技术维度上看不仅仅是对话技术,还会是多种前沿科技的集大成者,融合感知智能、认知智能和决策智能。就像也不能将ChatGPT仅仅看作是个聊天机器人,更多的应用,更新的模式,更大的商用价值,这才是ChatGPT真正带来的想象空间。
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。