OpenAI的“操作系统”野心:ChatGPT不再只是聊天机器人
2025年10月6日,OpenAI在旧金山举行其第三届DevDay年度大会。宣布了四大重磅的更新,同时公布了关键的一些产品数据值得关注。
OpenAI官方公布数据显示,目前累计已有4百万开发者利用OpenAI平台进行开发;ChatGPT的每周活跃用户已超过8亿;其中API平台峰值吞吐量达到每分钟60亿tokens(tokens per minute)。
OpenAI新目标:把ChatGPT打造成未来的操作系统
本届DevDay上,OpenAI正式推出“Apps in ChatGPT”框架——开发者可以通过SDK将自己的服务嵌入到ChatGPT中,用户无需离开聊天界面即可触发、交互、购买。
看上去OpenAI的目标是把ChatGPT打造成未来的操作系统,挑战传统安卓和苹果的生态地位。目前,首批支持的应用包括Booking.com、Canva、Coursera、Expedia、Spotify、Zillow等。比如只需要输入Coursera,ChatGPT就能自动识别并调用Coursera的功能,也可以直接要求在ChatGPT调用Canva作图。奥特曼预告称接下来还会上线更多应用。
这一动作其实是对OpenAI之前推出的“GPT Store”的延伸和升级。过去,开发者可以创建自己的GPT模型,但现在,他们能把这些服务直接“装进”ChatGPT,让用户在聊天时就能完成搜索、订票、学习或设计,无需跳出界面。更重要的是,这样的模式让OpenAI不再只是一个聊天入口,而开始变成一个能连接应用、交易和支付的平台。未来,用户可能在ChatGPT内就能看到推荐内容、完成购买、开发者也能从中获得分成——整个过程都在一个窗口里完成。
现在,苹果、谷歌、Meta、微软等科技巨头都在搭建自己的AI平台,希望把用户牢牢留在自家生态里。OpenAI如果不能尽快建立自己的应用体系和赚钱通道,就可能被这些“生态巨头”挤压。这次让应用直接嵌入ChatGPT的做法,可以看作是一次“反击”——OpenAI想用一个更开放、好用的平台,把用户重新吸引回来,让开发者和服务也能在它的系统里运转起来。
OpenAI发布AgentKit、Codex与全新API矩阵
除此前述新布局之外,OpenAI在DevDay上还重磅推出了面向开发者和企业的AgentKit套件,以及正式版Codex、多个API产品等,进一步强化其“AI应用+智能体”矩阵。
OpenAI正式推出AgentKit,这是一个面向开发者和企业的全流程工具集,旨在从构思到上线、再到性能优化,为智能体(agent)提供端到端支持。AgentKit包含三大核心组件:Agent Builder,一个可视化画布,开发者可以通过拖拽节点、参数配置、连线逻辑来构建多步骤的agent流程;Connector Registry,作为连接器管理层,用于统一管理各种数据源、工具API、内部系统的接入方式;ChatKit,用于将智能体的聊天界面嵌入到产品中,使得交互体验更自然、更易于定制。
在大会现场,OpenAI员工演示了从0开始搭建一个业务型智能体的过程:无需写一行代码,只需拖拽节点、设置参数,就能拼出一个完整流程;然后点击预览、运行、调试,几分钟内生成可上线版本。此外,OpenAI提到早期用户就已用AgentKit在数小时内构建起客服机器人或销售助理等多Agent工作流。比如金融服务公司Ramp宣称,用可视化界面构建一个“买家agent”流程从零起步只用了几个小时而非几个月。
AgentKit还集成了新的评估与优化机制:在AgentKit内部便支持Evals能力强化,比如trace grading、自动化prompt优化、第三方模型支持,以及RFT(强化反馈调优),从而在上线后能持续改进agent性能与稳定性。在这一体系与“Apps in ChatGPT”相结合的设计下,OpenAI 有望把“智能体 嵌入服务”形成协同效应。
在DevDay上,Sam Altman宣布Codex从研究预览版转为正式可用版本(GA,General Availability)。同时,他还推出Codex SDK,并支持在Slack中直接调用Codex解答技术问题或生成代码片段。
据现场演示,Codex的三个亮点值得关注:首先是Slack集成:企业用户可以在Slack聊天频道中向Codex提问或请求代码片段,Codex将在聊天流中直接回应,无需切换应用界面;其次是Codex SDK:企业可以将Codex的能力作为模块引入自家内部工作流、工具链中,自动化地扩展开发效率。
最大的亮点是语音交互,Codex正式版集成了语音输入能力,支持口语指令转为技术操作指令。例如在现场演示中,只需说一句“将灯光聚焦到观众席”,Codex就通过后台MCP服务器控制会场灯光系统,将观众席灯亮起。奥特曼提及,自今年8月预览版上线以来,Codex已处理40Ttokens的请求,成为OpenAI增长最快的产品之一。
目前来看,Codex正式版的推出,对OpenAI在开发者工具和企业自动化方向都是一大补充,不过它在复杂逻辑、跨模块调用、高安全性场景下仍有局限。
在大会尾声,奥特曼又重磅宣布三个新的API动作,引发业界高度关注。
GPT-5 Pro是OpenAI面向高端任务推出的顶级模型版本,其训练截止日期为2024年9月30日。该模型支持高达400k的上下文窗口,最大输出可达272ktoken。
在定价方面,OpenAI给出了输入价格为15美元/百万token(约为GPT-5的15倍),输出价格为120美元/百万token(约为GPT-5的12倍)。目前GPT-5Pro支持文本 图像输入,但仅支持文本输出。这条产品线的推出目的很明确:定位那些对上下文长度、理解复杂任务、专业推理要求极高的应用场景,比如科研写作、法律分析、长文档处理、复杂业务流程智能体等。
OpenAI本次也同时推出了一个轻量级的实时语音/聊天模型gpt-realtime-mini,其优势在于成本更低、延迟更低。相较于常规模型,它在成本方面有大幅度节约,更适合语音交互、实时对话这种高频场景。OpenAI在语音交互方向上的策略强调的是多模型组合,以适应不同场景下的计算与成本需求。
此外,Sora2也在DevDay中正式上线其预览API。2.0版本在视频生成、动态画面控制、内容可定制化方面进行了升级。目前尚未披露Sora2的具体定价和输出性能细节。不过奥特曼展示了Sora2在电商行业的一个案例。
演讲的最后,奥特曼表示,“我们的目标,是让AI对每一个人都真正有用,这一目标,离不开所有人的参与。”