OpenAI 正式发表 GPT-4。根据官方介绍,GPT-4 是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上的表现已经超越人类水准。比如:
- 已经能获得前 10% 的成绩,通过律师考试
- 具备影像解读能力,给 GPT-4 看梗图,能说出好笑之处
- 能从图片生成程式码,给 GPT-4 看网页框架手绘图,能生成该网页的程式码
- 对英文理解能力从 70.1% 进步到 85.5%,对中文理解能力进步到 80.1%
- 最弱的数学从 40% 进步到超过 70%
但是,GPT-4与以前的版本如ChatGPT和GPT-3.5有什么不同呢?
首先,名字意味着什么?尽管ChatGPT最初被描述为GPT-3.5(因此超出了GPT-3的一些迭代),但它本身并不是OpenAI大型语言模型的一个版本,而是一个基于聊天的接口,用于支持它的任何模型。过去几个月爆红的 ChatGPT 系统是与 GPT-3.5 进行交互的一种方式,现在它也是与 GPT-4 进行交互的一种方式。
让我们来看看你所了解和喜爱的聊天机器人与其新增强的后继者之间的区别。
1. GPT-4可以看到和理解图像
这个多功能机器学习系统最显著的变化是它是“多模态”的,这意味着它可以理解多个“模态”的信息。ChatGPT和GPT-3仅限于文本:它们可以读和写,但仅此而已(尽管对于许多应用程序来说已经足够了)。
然而,GPT-4可以给出图像,并对其进行处理以找到相关信息。当然,你可以简单地要求它描述图片中的内容,但更重要的是,它的理解能力不止于此。OpenAI提供的例子实际上是用一个滑稽的大号iPhone连接器的图片来解释这个笑话,但与Be My Eyes的合作更能说明问题。Be My Eyes是一款盲人和低视力人群使用的应用程序,让志愿者描述他们的手机看到了什么。
在Be My Eyes的视频中,GPT-4描述了一件衣服上的图案,识别了一种植物,解释了如何到达健身房的某个机器,翻译了标签(并提供了食谱),读取了地图,并执行了许多其他任务,这些任务表明,如果它被问到正确的问题,它确实理解了图像中的内容,它知道裙子的样子,但它可能不知道这件衣服是否适合你的面试。
2. GPT-4更难被欺骗
尽管今天的聊天机器人做得很好,但它们往往很容易误入歧途。一点点劝说就能说服他们,他们只是在解释一个“糟糕的AI”会做什么,或者是一些其他的小虚构,让模型说出各种奇怪的、坦率地说令人不安的事情。人们甚至合作“越狱”提示,迅速让ChatGPT和其他人摆脱束缚。
另一方面,GPT-4已经接受了大量恶意提示的训练——这些提示是用户在过去一两年给OpenAI提供的。考虑到这些,新模型在“真实性、可导向性和拒绝走出护栏”方面比以前的模型要好得多。
根据OpenAI的描述,GPT-3.5(支持ChatGPT)是一种新的训练架构的“试运行”,他们将从中吸取的经验教训应用到“前所未有的稳定”的新版本中,他们也能更好地预测它的能力,这就减少了意外。
3.GPT-4记忆更持久
这些大型语言模型是在数百万个网页、书籍和其他文本数据上进行训练的,但当它们真正与用户对话时,它们能“记住”的东西是有限的。GPT-3.5和旧版本的ChatGPT的限制是4096个“标记”,大约是8000个单词,或者大约是一本书的4到5页。因此,当它们在注意力功能中传递到那么远的“后面”时,它就会失去对事物的跟踪。
GPT-4的最大令牌数为32,768——也就是2的15次方,如果你想知道为什么这个数字看起来很熟悉的话。这相当于大约64000个单词或50页文本,足够写成一部戏剧或短篇故事。
这意味着在对话或生成文本时,它将能够记住50页左右的内容。所以它会记得你20页的聊天内容,或者在写一篇故事或文章时,它可能会提到35页前发生的事件。这是对注意力机制和标记计数如何工作的一个非常近似的描述,但总体思想是关于扩展记忆和伴随它的功能。
4. GPT-4支持更加语言
人工智能世界由说英语的人主导,从数据到测试再到研究论文,一切都用英语。当然,大型语言模型的功能适用于任何书面语言,并且应该在这些语言中提供。
GPT-4朝着这一目标迈出了一步,它证明自己能够在26种语言(从意大利语、乌克兰语到韩语)中高精度地回答数千道选择题。它最擅长罗曼语和日耳曼语,但也能很好地推广到其他语言。
这种对语言能力的初步测试是有希望的,但距离完全拥抱多语言能力还很远。测试标准一开始就是从英语翻译过来的,选择题并不能真正代表普通的口语。但它在一些它并不是专门训练的事情上做得很好,这说明GPT-4对非英语使用者更友好的可能性。
5. GPT-4具有不同的“个性”
“可导向性”是人工智能中一个有趣的概念,指的是它们根据需求改变行为的能力。这可能是有用的,比如扮演一个有同情心的倾听者的角色,或者是危险的,比如当人们让模型相信它是邪恶或抑郁的时候。
GPT-4比GPT-3.5更原生地集成了导向性,用户将能够将“具有固定冗长、语气和风格的经典ChatGPT个性”更改为更适合他们需要的内容。“在界限之内,”团队很快指出,这是让模型打破角色的最简单方法。
在某种程度上,可以用“假装你是桌面RPG游戏中的DM”或“像接受有线新闻采访一样回答”这样的信息来启动聊天机器人。但实际上,你只是在对“默认的”GPT-3.5人格提出建议。现在,开发者可以从一开始就设计视角、对话风格、语气或交互方法。
GPT-4和它的前辈之间有很多不同之处,大多数比这些更微妙或更技术性。毫无疑问,随着时间的推移和用户对最新语言模型的测试,我们将学到更多。
—煤油灯科技victorlamp.com编译整理—
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。