OpenAI发布了一个强大的新图像和文本理解 AI 模型GPT-4,该公司称它是“扩大深度学习努力的最新里程碑”。,, GPT-4今天可通过ChatGPT Plus (有使用上限)提供给 OpenAI 的付费用户,开发人员也可以在等候名单上注册以访问该 API。, 定价为每1,000个“提示”标记(约750个单词)0.03美元和每1,000个“完成”标记(同样,约750个单词)0.06美元。令牌代表原始文本;例如,“fantastic”这个词将被拆分为“fan”、“tas”和“tic”等标记。Prompt tokens 是输入 GPT-4的单词部分,而 completion tokens 是由 GPT-4生成的内容。, 微软今天宣布,其与 OpenAI 共同开发的聊天机器人技术Bing Chat正在 GPT-4上运行。, 其他早期采用者包括 Stripe,它使用GPT-4扫描商业网站并向客户支持人员提供摘要。Duolingo将 GPT-4构建到新的语言学习订阅层中。摩根士丹利正在创建一个由 GPT-4驱动的系统,该系统将从公司文件中检索信息并将其提供给金融分析师。可汗学院正在利用 GPT-4构建某种自动化导师。, GPT-4可以生成文本并接受图像和文本输入——这是对其前身GPT-3.5的改进,GPT-3.5仅接受文本——并且在各种专业和学术基准测试中的表现达到“人类水平”。例如,GPT-4通过模拟律师考试,分数在应试者的前10% 左右;相比之下,GPT-3.5的得分在倒数10% 左右。, 据该公司称,OpenAI 花了六个月的时间使用内部对抗性测试程序和 ChatGPT 的经验教训“迭代调整”GPT-4,从而在真实性、可控性和拒绝超出护栏方面取得了“有史以来最好的结果”。与之前的 GPT 模型一样,GPT-4是使用公开数据(包括来自公共网页)以及 OpenAI 许可的数据进行训练的。, OpenAI 与微软合作,在 Azure 云中从头开始开发了一台“超级计算机”,用于训练 GPT-4。, “在随意的谈话中,GPT-3.5和 GPT-4之间的区别可能很微妙,”OpenAI 在宣布 GPT-4的博客文章中写道。“当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比 GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。”, 毫无疑问,GPT-4更有趣的方面之一是它能够理解图像和文本。GPT-4可以对相对复杂的图像进行说明甚至解释,例如从插入电源的 iPhone 的图片中识别闪电电缆适配器。, 图像理解能力目前还没有提供给所有 OpenAI 客户——OpenAI 正在与一个合作伙伴 Be My Eyes 一起测试它。在 GPT-4的支持下,Be My Eyes 的新虚拟志愿者功能可以回答有关发送给它的图像的问题。该公司在博客文章中解释了它是如何工作的:, “例如,如果用户发送他们冰箱内部的图片,虚拟志愿者不仅能够正确识别里面的东西,还能推断和分析可以用这些成分准备什么。该工具还可以为这些成分提供一些食谱,并发送有关如何制作它们的分步指南。”, GPT-4的一个更有意义的改进可能是上述的可操纵性工具。借助 GPT-4,OpenAI 引入了一种新的 API 功能,即“系统”消息,它允许开发人员通过描述特定方向来规定风格和任务。系统消息,也将在未来出现在 ChatGPT 中,本质上是为 AI 的下一次交互设定基调和边界的指令。, 例如,一条系统消息可能是这样的:“你是一位总是以苏格拉底式方式回应的导师。你永远不会给学生答案,但总是试着问正确的问题来帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。”, 不过,即使有系统消息和其他升级,OpenAI 也承认 GPT-4远非完美。它仍然“幻觉”事实并犯推理错误,有时还非常自信。在 OpenAI 引用的一个例子中,GPT-4将猫王描述为“演员之子”——这是一个明显的失误。, OpenAI 写道:“GPT-4普遍缺乏对绝大多数数据中断(2021年9月)后发生的事件的了解,并且没有从中吸取经验教训。” “它有时会犯一些简单的推理错误,这些错误似乎与跨多个领域的能力不相称,或者在接受用户明显的虚假陈述时过于轻信。有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”, 不过,OpenAI 确实指出,它在特定领域做出了改进;一方面,GPT-4不太可能拒绝关于如何合成危险化学品的请求。该公司表示,与 GPT-3.5相比,GPT-4总体上响应“不允许”内容请求的可能性降低了82%,并且根据 OpenAI 的政策响应敏感请求——例如医疗建议和任何与自我伤害有关的请求29% 更频繁。, GPT-4显然有很多东西要解压。但就 OpenAI 而言,它正在全速前进——显然对其所做的改进充满信心。, OpenAI 写道:“我们期待 GPT-4成为一种有价值的工具,通过为许多应用程序提供动力来改善人们的生活。” “还有很多工作要做,我们期待通过社区在模型之上构建、探索和贡献的集体努力来改进这个模型。”