• 周一. 5 月 27th, 2024

OpenAI 让 GPT-4 普遍可用

OpenAI 今天宣布通过其 API全面推出其最新的文本生成模型GPT-4 。

从今天下午开始,所有“具有成功付款历史”的现有 OpenAI API 开发人员都可以访问 GPT-4。该公司计划在本月底之前向新开发人员开放访问权限,然后“根据计算可用性”开始提高可用性限制。

OpenAI 在博客文章中写道:“自 3 月份以来,数以百万计的开发人员请求访问 GPT-4 API,并且利用 GPT-4 的创新产品的范围每天都在增长。” “我们设想未来基于聊天的模型可以支持任何用例。”

GPT-4 可以生成文本(包括代码)并接受图像和文本输入,这是对其前身GPT-3.5的改进, GPT-3.5只接受文本,并且在各种专业和学术基准上表现出“人类水平”。与 OpenAI 之前的 GPT 模型一样,GPT-4 是使用公开数据进行训练的,包括来自公共网页的数据以及 OpenAI 许可的数据。

目前,图像理解功能尚未提供给所有 OpenAI 客户。首先,OpenAI 与单一合作伙伴Be My Eyes进行了测试。但它没有表明何时向更广泛的客户群开放。

值得注意的是,即使是当今最好的生成式 AI 模型,GPT-4 也并不完美。它会“幻觉”事实并犯下推理错误,有时甚至充满信心。而且它没有从经验中吸取教训,在诸如在其生成的代码中引入安全漏洞等难题上失败了。

OpenAI 表示,未来,它将允许开发人员微调 GPT-4 和GPT-3.5 Turbo,这是其其他最近但能力较弱的文本生成模型之一(也是为ChatGPT提供支持的原始模型之一),自己的数据,就像 OpenAI 的其他几个文本生成模型长期以来所做的那样。据 OpenAI 称,该功能将于今年晚些时候推出。

自 3 月份 GPT-4 发布以来,生成式 AI 竞争变得更加激烈。最近,Anthropic 将Claude的上下文窗口(其旗舰文本生工智能模型,仍处于预览状态)从 9,000 个令牌扩展到 100,000 个令牌。(上下文窗口是指模型在生成附加文本之虑的文本,而标记表示原始文本 – 例如,单词“fantastic”将被拆分为标记“fan”、“tas”和“tic”。)

GPT-4在上下文窗口方面保持着之前的桂冠,在高端的权重为 32,000 个代币。一般来说,上下文窗口较小的模型往往会“忘记”最近的对话内容,从而导致偏离主题。

在今天的相关公告中,OpenAI 表示,它正在全面提供 DALL-E 2 和 Whisper API—— DALL-E 2是 OpenAI 的图像生成模型,“ Whisper ”指的是该公司的语音到文本模型。该公司还表示,计划弃用通过其 API 提供的旧模型,以“优化[其]计算能力”。(在过去的几个月里,很大程度上由于 ChatGPT 的爆炸式流行,OpenAI 一直难以满足对其生成模型的需求。)

从 2024 年 1 月 4 日开始,某些较旧的 OpenAI 模型(特别是 GPT-3 及其衍生物)将不再可用,并将被新的“基础 GPT-3”模型所取代,人们认为这些模型的计算效率更高。使用旧模型的开发人员必须在 1 月 4 日之前手动升级其集成,而那些希望在 1 月 4 日之后继续使用经过微调的旧模型的开发人员将需要在新的基本 GPT-3 模型之上微调替换模型。

OpenAI 写道:“我们将为之前微调模型的用户提供支持,以使这一过渡尽可能顺利。” “在接下来的几周内,我们将联系最近使用过这些旧模型的开发人员,并在新的完成模型准备好进行早期测试后提供更多信息。”