中信建投:大厂AI产品迭代加速 行业持续繁荣
中信建投研报表示,OpenAI推出三款GPT-4.1系列模型,以及新推理模型o3和o4-mini,在多模态处理、代码能力、指令遵循、推理和成本方面实现显著优化。同时,o3模型开发过程中推理侧Scaling law仍在持续,验证强化学习范式拓展方向正确性。豆包大模型日均tokens调用量已超过12.7万亿,已达到2024年12月的3倍,豆包1.5深度思考模型上线后有望进一步促进用户使用。阿里AI开源社区魔搭于4月15日推出全新MCP广场,独家首发支付宝、MiniMax等全新MCP服务,继续加速MCP生态边界拓展。
全文如下
中信建投:大厂AI产品迭代加速,行业持续繁荣
OpenAI推出三款GPT-4.1系列模型,以及新推理模型o3和o4-mini,在多模态处理、代码能力、指令遵循、推理和成本方面实现显著优化。同时,o3模型开发过程中推理侧Scaling law仍在持续,验证强化学习范式拓展方向正确性。豆包大模型日均tokens调用量已超过12.7万亿,已达到2024年12月的3倍,豆包1.5深度思考模型上线后有望进一步促进用户使用。阿里AI开源社区魔搭于4月15日推出全新MCP广场,独家首发支付宝、MiniMax等全新MCP服务,继续加速MCP生态边界拓展。
继4月14日智谱开源 32B/9B 系列 GLM 模型以来,本周AI产业进展进一步加速。
OpenAI:通用及推理模型更新,推理Scaling law持续验证。
4月15日,OpenAI推出三款GPT-4.1系列模型,在多模态处理、代码能力、指令遵循和成本方面实现显著提升。编码方面,GPT-4.1在SWE-bench验证测试中得分54.6%,较GPT-4o提升了21.4%,较GPT-4.5提升了26.6%;在Scale的衡量指令遵循能力指标的MultiChallenge基准测试中,GPT-4.1得分38.3%,较GPT-4o提升了10.5%;在多模态长文本理解的Video-MME基准测试中,GPT-4.1在无字幕的长文本类别中得分72.0%,较GPT-4o提升了6.7%;价格方面,对于中等规模的查询,GPT-4.1的价格比GPT-4o低26%,对于重复使用相同上下文的查询,OpenAI将提示缓存折扣从之前的50%提高到了75%。
4月17日,OpenAI最新推理模型o3和o4-mini,较此前版本会在响应之前进行更长时间的思考。作为OpenAI目前最强的推理模型,o3在Codeforces、SWE-bench和MMMU等基准测试中创下了新的 SOTA;o4-mini 则是经济高效的小型模型,尤其在数学、编程和视觉任务方面表现较好,在AIME 2024和2025,以及Codeforces基准测试中表现甚至超过o3。API价格方面,o3比o1全方位(输入、cached 输入和输出)降低,o4-mini 也比 o3-mini 部分降低。此外,o3和o4-mini首次支持在思维链中运用图像进行思考,成功实现视觉和文本推理的结合,且可以完成对模糊、反转或质量低下图像的解读。
值得一提的是,o3模型开发过程中,OpenAI 在训练计算和推理时间方面又提高了一个数量级,仍看到了模型性能的持续提升,即推理侧Scaling law仍在持续,一定程度验证了各厂商对强化学习范式拓展方向的正确性。
字节跳动:豆包1.5深度思考模型上线,同样支持视觉推理。
4月17日,字节火山引擎发布豆包1.5深度思考模型,升级豆包文生图模型3.0、豆包视觉理解模型。其中,豆包1.5深度思考模型采用 MoE 架构,总参数200B,激活参数20B,提供极高并发承载能力的同时,实现20毫秒极低延迟,在数学、代码、科学等专业领域推理任务中表现出色,已经达到或接近全球第一梯队水平;同时在创意写作等非推理任务中也展示出优秀的泛化能力。升级的豆包文生图模型3.0和豆包视觉理解模型则分别在图像生成和理解方面做出突破,前者在Artificial Analysis 竞技场中已超越业界诸多主流模型,排名全球第一梯队;后者在视觉定位和视频理解方面能力有所提升。
此外,豆包深度思考模型同步上线了“边想边搜”和“视觉推理”两个重磅功能。“边想边搜” 模拟人类解决问题的方式,会基于每一步的思考结果进行多次搜索,使回答更贴近用户需求;而“视觉推理”则紧随OpenAI o3的步伐,使模型能够基于图像进行深度思考。
据火山引擎数据,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,已达到2024年12月的(4万亿)3倍,为2024年5月(1200亿)刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。我们认为,高性能模型能够促进用户用量,而用户使用又能反哺模型迭代,实现正向循环,推动模型进一步优化迭代。
阿里巴巴:全面拥抱MCP服务,完善AI Agent生态。
继4月9日阿里云百炼正式上线 MCP服务完整平台能力后,阿里AI开源社区魔搭于4月15日推出全新MCP广场,上架千余款热门的MCP服务,并独家首发支付宝、MiniMax等全新MCP服务。例如,支付宝MCP服务提供支付宝交易创建、查询、退款等能力,让AI智能体一键接入支付能力,打通从AI服务到AI商业化的“最后一公里”;MiniMax则将领先的语音生成、语音克隆、图片生成以及视频生成等模型封装成可统一调用的MCP工具,让文本大模型具备升级为多模态模型的基础。
MCP服务协议于24年11月开源以来,Block、Apollo、Replit等公司加速支持,直至25年2月已有超过1000个由社区构建的MCP服务器可供使用;3月27日,OpenAI Agents SDK支持了MCP服务协议,同时ChatGPT桌面应用和Responses API也将很快支持;3月30日,腾讯云开发者社区就已有 EdgeOne Pages 「MCP Server」内容发布;4月1日百度智能云也预告其MCP计划。大厂入局有望加速MCP生态边界拓展,生态-产品-用户正反馈机制有望加速AI落地进程。
总结:OpenAI推出三款GPT-4.1系列模型,以及新推理模型o3和o4-mini,在多模态处理、代码能力、指令遵循、推理和成本方面实现显著优化。同时,o3模型开发过程中推理侧Scaling law仍在持续,验证强化学习范式拓展方向正确性。豆包大模型日均tokens调用量已超过12.7万亿,已达到2024年12月的3倍,豆包1.5深度思考模型上线后有望进一步促进用户使用。阿里AI开源社区魔搭于4月15日推出全新MCP广场,独家首发支付宝、MiniMax等全新MCP服务,继续加速MCP生态边界拓展。
(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。