概述
首批插件发布给了一小部分受邀用户和等待名单上的用户,包括Expedia、FiscalNote、Instacart、KAYAK、Klarna Shopping、Milo Family AI、OpenTable、Shop、Speak、Wolfram和Zapier。这些扩展可以让用户在聊天界面中购物、预订餐厅、进行计算、订购航班、购买产品、学习新语言以及访问数据等等。
除了这些插件之外,还有一个代码解释器插件,可以在聊天界面中的沙盒中编译代码。OpenAI还向公众提供了知识库检索插件的代码,使开发者可以将他们的数据直接添加到ChatGPT中。对于想要开发新插件的开发者来说,现在有一个等待名单。
ChatGPT插件的发布是向着将对话式AI转变为更具能力、更智能的代理迈出的重要第一步,而不仅仅是知识型顾问。这个新的智能代理可以为用户完成任务,而不仅仅是给他们关于如何完成这些任务的建议。
插件使得ChatGPT成为了一个“一切应用”,将其能力扩展到了互联网的领域。ChatGPT已经拥有了1亿用户。现在,它有了一个应用商店。它正在以自己的方式成为一个操作系统,可能会重新定义整个互联网和浏览体验,将ChatGPT从一个相对封闭的服务,其输出和雄心受其训练数据限制,转变为一个只受其插件服务限制的全能代理。
有了插件,ChatGPT从浏览器中的另一个标签变成了一个可以控制您的浏览器的应用,具有全功能助手的功能。这引入了一种与我们的计算机和手机交互的全新方式,可能会取代主屏幕、谷歌搜索和信息流,将ChatGPT从一个演示变成一个独立的平台。
如何构建插件以及插件如何改变软件开发
除了改变互联网浏览体验之外,插件还改变了软件开发和编码的方式。通常情况下,要连接两个程序,开发人员需要了解系统如何通过API与不同系统交互,并编写“胶水代码”,使两个服务能够相互通信。而插件提供了一种不同的方法。
要创建ChatGPT插件,开发人员只需简单地指导模型。开发人员向ChatGPT提供了服务API的清单,用简单的英语描述。ChatGPT读取此清单并为其生成胶水代码。开发人员仍然需要编写初始API的代码。
软件开发长期以来一直在为隐藏人类友好界面背后的二进制逻辑复杂性添加新的抽象层,从汇编语言到更高级别的编码环境再到图形用户界面(GUI)。OpenAI的最新发展开始实现自然语言编程工具的承诺,让人们可以用英语创建代码并指导计算机。
如今,大型语言模型可以接受程序员用人类语言传达的指令。虽然结果还远非完美,但传递错误消息使语言模型能够自我修正并返回新的、更好的代码。简而言之,结果远远好于几个月或一年前的预期。此外,ChatGPT还能解释代码并回答关于其如何工作的问题。
这并不一定意味着程序员立即失业。生成式AI仍然在不断改进,仍然会幻想填补知识空白的信息。它最适合作为程序员的助手,而不是他们的替代品。虽然仍然需要人类程序员发明和设计新型系统和技术,并解决AI尚不能解决的问题,但对于将软件系统连接在一起的机械性劳动的需求可能会减少,而这占据了很大一部分当前的开发工作。
多亏了ChatGPT的代码解释器插件,该模型现在可以在沙盒环境中使用Python并管理上传和下载。代码解释器有助于解决数学问题,分析数据,显示表格,并转换文件格式,等等。
总结
对于普通用户,插件就像是模型的眼睛和耳朵,使他们能够更多地访问最新的、特定的或个人的数据。对于程序员来说,插件是应用程序和服务的新分发渠道。通过向清单中添加授权凭据,插件使得可以代表用户执行受限制和安全的操作。
虽然可用性仍然仅限于一小部分开发人员和ChatGPT Plus用户,但OpenAI计划随着时间逐渐扩大访问范围。

