OpenAI的“操作系统”野心：ChatGPT不再只是聊天机器人-助攻财富

　　2025年10月6日，OpenAI在旧金山举行其第三届DevDay年度大会。宣布了四大重磅的更新，同时公布了关键的一些产品数据值得关注。

　　OpenAI官方公布数据显示，目前累计已有4百万开发者利用OpenAI平台进行开发；ChatGPT的每周活跃用户已超过8亿；其中API平台峰值吞吐量达到每分钟60亿tokens（tokens per minute）。

　　OpenAI新目标：把ChatGPT打造成未来的操作系统

　　本届DevDay上，OpenAI正式推出“Apps in ChatGPT”框架——开发者可以通过SDK将自己的服务嵌入到ChatGPT中，用户无需离开聊天界面即可触发、交互、购买。

　　看上去OpenAI的目标是把ChatGPT打造成未来的操作系统，挑战传统安卓和苹果的生态地位。目前，首批支持的应用包括Booking.com、Canva、Coursera、Expedia、Spotify、Zillow等。比如只需要输入Coursera，ChatGPT就能自动识别并调用Coursera的功能，也可以直接要求在ChatGPT调用Canva作图。奥特曼预告称接下来还会上线更多应用。

　　这一动作其实是对OpenAI之前推出的“GPT Store”的延伸和升级。过去，开发者可以创建自己的GPT模型，但现在，他们能把这些服务直接“装进”ChatGPT，让用户在聊天时就能完成搜索、订票、学习或设计，无需跳出界面。更重要的是，这样的模式让OpenAI不再只是一个聊天入口，而开始变成一个能连接应用、交易和支付的平台。未来，用户可能在ChatGPT内就能看到推荐内容、完成购买、开发者也能从中获得分成——整个过程都在一个窗口里完成。

　　现在，苹果、谷歌、Meta、微软等科技巨头都在搭建自己的AI平台，希望把用户牢牢留在自家生态里。OpenAI如果不能尽快建立自己的应用体系和赚钱通道，就可能被这些“生态巨头”挤压。这次让应用直接嵌入ChatGPT的做法，可以看作是一次“反击”——OpenAI想用一个更开放、好用的平台，把用户重新吸引回来，让开发者和服务也能在它的系统里运转起来。

　　OpenAI发布AgentKit、Codex与全新API矩阵

　　除此前述新布局之外，OpenAI在DevDay上还重磅推出了面向开发者和企业的AgentKit套件，以及正式版Codex、多个API产品等，进一步强化其“AI应用＋智能体”矩阵。

　　OpenAI正式推出AgentKit，这是一个面向开发者和企业的全流程工具集，旨在从构思到上线、再到性能优化，为智能体（agent）提供端到端支持。AgentKit包含三大核心组件：Agent Builder，一个可视化画布，开发者可以通过拖拽节点、参数配置、连线逻辑来构建多步骤的agent流程；Connector Registry，作为连接器管理层，用于统一管理各种数据源、工具API、内部系统的接入方式；ChatKit，用于将智能体的聊天界面嵌入到产品中，使得交互体验更自然、更易于定制。

　　在大会现场，OpenAI员工演示了从0开始搭建一个业务型智能体的过程：无需写一行代码，只需拖拽节点、设置参数，就能拼出一个完整流程；然后点击预览、运行、调试，几分钟内生成可上线版本。此外，OpenAI提到早期用户就已用AgentKit在数小时内构建起客服机器人或销售助理等多Agent工作流。比如金融服务公司Ramp宣称，用可视化界面构建一个“买家agent”流程从零起步只用了几个小时而非几个月。

　　AgentKit还集成了新的评估与优化机制：在AgentKit内部便支持Evals能力强化，比如trace grading、自动化prompt优化、第三方模型支持，以及RFT（强化反馈调优），从而在上线后能持续改进agent性能与稳定性。在这一体系与“Apps in ChatGPT”相结合的设计下，OpenAI 有望把“智能体嵌入服务”形成协同效应。

　　在DevDay上，Sam Altman宣布Codex从研究预览版转为正式可用版本（GA，General Availability）。同时，他还推出Codex SDK，并支持在Slack中直接调用Codex解答技术问题或生成代码片段。

　　据现场演示，Codex的三个亮点值得关注：首先是Slack集成：企业用户可以在Slack聊天频道中向Codex提问或请求代码片段，Codex将在聊天流中直接回应，无需切换应用界面；其次是Codex SDK：企业可以将Codex的能力作为模块引入自家内部工作流、工具链中，自动化地扩展开发效率。

　　最大的亮点是语音交互，Codex正式版集成了语音输入能力，支持口语指令转为技术操作指令。例如在现场演示中，只需说一句“将灯光聚焦到观众席”，Codex就通过后台MCP服务器控制会场灯光系统，将观众席灯亮起。奥特曼提及，自今年8月预览版上线以来，Codex已处理40Ttokens的请求，成为OpenAI增长最快的产品之一。

　　目前来看，Codex正式版的推出，对OpenAI在开发者工具和企业自动化方向都是一大补充，不过它在复杂逻辑、跨模块调用、高安全性场景下仍有局限。

　　在大会尾声，奥特曼又重磅宣布三个新的API动作，引发业界高度关注。

　　GPT-5 Pro是OpenAI面向高端任务推出的顶级模型版本，其训练截止日期为2024年9月30日。该模型支持高达400k的上下文窗口，最大输出可达272ktoken。

　　在定价方面，OpenAI给出了输入价格为15美元／百万token（约为GPT-5的15倍），输出价格为120美元／百万token（约为GPT-5的12倍）。目前GPT-5Pro支持文本图像输入，但仅支持文本输出。这条产品线的推出目的很明确：定位那些对上下文长度、理解复杂任务、专业推理要求极高的应用场景，比如科研写作、法律分析、长文档处理、复杂业务流程智能体等。

　　OpenAI本次也同时推出了一个轻量级的实时语音/聊天模型gpt-realtime-mini，其优势在于成本更低、延迟更低。相较于常规模型，它在成本方面有大幅度节约，更适合语音交互、实时对话这种高频场景。OpenAI在语音交互方向上的策略强调的是多模型组合，以适应不同场景下的计算与成本需求。

　　此外，Sora2也在DevDay中正式上线其预览API。2.0版本在视频生成、动态画面控制、内容可定制化方面进行了升级。目前尚未披露Sora2的具体定价和输出性能细节。不过奥特曼展示了Sora2在电商行业的一个案例。

　　演讲的最后，奥特曼表示，“我们的目标，是让AI对每一个人都真正有用，这一目标，离不开所有人的参与。”

OpenAI的“操作系统”野心：ChatGPT不再只是聊天机器人

相关推荐