软硬结合,共赴服务器操作系统的云智未来
引言:
随着 CentOS 停服、信创产业蓬勃发展、生成式 AI 浪潮来袭等大事件接连发生,国产服务器操作系统正在迎来前所未有的崛起机遇。据信通院近期调查显示,国内大量服务器操作系统用户已经开始了国产替换的考量或计划,有意愿且已开始试点或制定计划的用户高达 72%,意向用户占 12%。与此同时,在多样性算力和智能计算快速发展的背景下,服务器操作系统产业正在步入 2.0 时代,新一代国产服务器操作系统开始全面围绕如何充分释放计算能力的核心问题,面向以云计算、智能计算为主的技术方向进化,这一变化进一步加快了主流用户向国产操作系统迁移的进度。
在国产服务器操作系统百花齐放的局面中,龙蜥操作系统社区是发展水平较高、品牌市场基础较好的榜样之一。2023 年 12 月 17-18 日,首届龙蜥操作系统大会在北京召开,以《云智融合 共筑未来》为主题,宣告龙蜥社区到达了一个新的发展节点。大会筹备期间,InfoQ 采访了龙蜥社区副理事长单位,英特尔公司软件与先进技术事业部研发总监杨继国,就英特尔公司与龙蜥战略合作、社区共建以及云智融合对服务器操作系统的影响等主题进行了深入探讨。
生态共建,英特尔与龙蜥社区携手同行
英特尔公司是在 2020 年首批加入龙蜥社区的 14 家理事单位之一,英特尔也同时加入了龙蜥社区的技术委员会、运营委员会,与其他伙伴共同推动社区的生态发展。在龙蜥社区,各项社区活动总体是以各个社区兴趣小组为基础展开的,英特尔也创建了名为 Intel SIG 的兴趣小组,并参与和促进了总共 14 个相关兴趣小组的发展。这些小组共同努力,使得龙蜥操作系统对各大主流芯片架构、平台技术的支持达到了业内领先水平,例如英特尔第四代、第五代至强可扩展处理器的 AMX 加速引擎、QAT 网络加速、TDX 安全虚拟机技术等创新特性就第一时间在龙蜥系统中得到了支持。此外,英特尔还向社区贡献了很多英特尔与龙蜥共同运用的技术最佳实践,并举办了多场线上、线下 Meetup、Workshop,与社区共同撰写技术白皮书等,通过多种形式推动社区生态发展。
在英特尔看来,龙蜥社区是国内领先的系统软件和开源生态社区,对国产软件生态有着很大的影响力和促进作用。英特尔与龙蜥社区的合作对双方的技术创新和生态拓展都有良好的推动力,一方面英特尔能够帮助社区在先进芯片技术支持方面维持领先地位,另一方面龙蜥社区也能帮助英特尔将很多最新的平台技术、软件特性高效传递给用户。例如,Intel SIG 帮助龙蜥操作系统的很多发行版对英特尔至强平台提供了完善支持,还通过最佳实践教学用户将至强平台的新特性充分利用起来;阿里云等社区合作伙伴也在英特尔的帮助下,在自身产品中运用了英特尔平台的创新特性,等等。
英特尔公司在龙蜥社区中的经历只是龙蜥开放生态的一个缩影。整体而言,龙蜥是多元化的开源技术生态社区,有来自各个行业的生态伙伴共同参与,丰富的多样性使这些生态伙伴能够将不同行业的经验和需求都带入社区广泛交流应对。由此以来,当社区协商龙蜥的技术发展路线、开发不同的发行版等工作时,就能充分考虑到不同垂直行业的需求、利用各类创新技术成果,使得龙蜥的技术发展紧跟行业大趋势,进而在关键节点上推动各行各业的数字化升级。
国产服务器操作系统崛起,云智融合成为行业方向
今天,服务器操作系统技术正在从传统的服务器硬件管理、支撑应用运行逐渐向覆盖云、边、端多场景,支持多样化算力的方向升级迭代,服务器操作系统的边界不断拓展,针对不同场景的深度定制化与对异构算力的优化成为技术突破重点。在这样的背景下,国产开源服务器操作系统近年来发展飞快,以龙蜥为代表的新一代国产操作系统从发展伊始就面向全新的行业趋势来开发设计,从而很快得到了行业的认可与应用。仅以龙蜥操作系统为例,目前其装机量超过 600 万,服务各个行业用户超过 80 万,在政务、金融、电信、互联网等领域有着较好的用户基础,竞争力持续提升。此外,龙蜥开启捐献到了开放原子开源基金会的流程,为开源产业的发展做出了贡献和表率。
随着云计算和人工智能技术的飞跃式进步,行业也需要服务器操作系统进行对应的升级。2023 年是生成式 AI全面爆发的元年,硬件产业做了很多创新来为大模型等 AI 应用提供更加充沛的算力支持。英特尔就在第四代至强处理器上引入了 AMX 加速引擎、动态负载均衡加速器 DLB、数据流加速器 DIC 和 TDX 安全虚拟技术,帮助云厂商以更低的 TCO、更加安全可信赖的环境为用户提供更高算力的生成式 AI 服务。对此,英特尔与龙蜥社区共同规划合作,在 2023 年的主要版本更新中率先支持了第四代至强处理器的诸多特性,有力支持了云厂商的生成式 AI 服务升级。
纵观全局,云计算与人工智能的发展是互相促进,相辅相成的。云计算能够为 AI 提供大规模、多样化的并行 AI 算力支持,大模型可以充分利用云端海量数据进行训练和推理,且云计算全球化部署的特性使得 AI 产品可以轻松为全球用户提供服务。反过来说,AI 也能够为云计算提供更加智能的技术和运维支持,提升服务质量,实现智能服务调度和优化、智能算力预测等智算功能,帮助云厂商提升服务效率,降低 TCO。云计算与人工智能结合,还让更多缺乏足够资源的中小企业可以轻松运用大模型等前沿技术进行业务创新,改善用户体验。
服务器操作系统作为云计算基础设施的重要组成部分,在云智融合、携同发展的技术大势中肩负着重要任务。新一代服务器操作系统需要提供更好的解决方案,完美地融合各类开源工具链,帮助 AI 开发者和用户能够更轻松地构造、部署、管理和使用基于云计算的 AI 服务。另一大挑战来自安全性,AI 服务的基础模型、算法和数据都需要更加完善的安全防护,预防窃取、篡改和滥用,这就要求操作系统建立更加安全、高效的响应机制。操作系统需要依托开源社区和专业安全机构,第一时间获取软件漏洞信息,同时通过迅捷的安全修复机制尽快修复漏洞,并及时响应已发生的安全攻击事件。最后,云智时代软硬件技术的频繁升级还会带来很多兼容性挑战,服务器硬件组件的持续升级需要软件层面优化适配,服务器操作系统的升级又可能对云智环境中的已有组件产生影响,极端情况下甚至可能需要组件重构代码以继续运行。这些兼容性问题需要操作系统和云服务厂商提前合理规划,实现平稳升级过渡,避免兼容性问题导致服务中断等事件。
针对上述问题,龙蜥社区的开放和共建体系发挥出了很大优势。由于龙蜥社区非常注重技术创新进步,社区成员都很活跃,社区建立了能够吸纳创新技术、建立自身技术优势的机制。例如,英特尔的硬件团队在芯片设计阶段就会与软件团队紧密沟通,收集社区用户的反馈来调整设计,同时软件团队会提前开始新特性的优化适配工作。以上文提到的 AMX 加速引擎为例,龙蜥社区就很早引入了 AMX 指令来加速 AI 深度学习效率,获得两倍甚至更高的性能提升。又如英特尔 TDX 安全虚拟技术也在一两年前就开始在龙蜥社区引入,很早就完成了代码集成、测试等工作,提前集成到了龙蜥操作系统中。TDX 技术使得云计算环境中,用户向云端上传的数据可以得到处理器硬件级的端到端加密保护,即便云厂商自身也无法解密获取,这样的设计极大提升了用户信心,为云端生成式 AI 等服务的普及打通了重要瓶颈。
云智融合成为行业主要技术方向的当下,龙蜥社区的开放架构与创新机制使得更多厂商能够像英特尔一样,与社区内的其他产业伙伴共同加快创新技术的研发与应用过程。龙蜥社区的繁荣生态环境,也为国产服务器操作系统的崛起起到了引领作用,助力更多企业向国产操作系统迁移,并充分利用云计算与生成式 AI 等前沿技术的能力创造价值。
公平中立、开放活跃,龙蜥为开源社区治理作出表率
作为开源服务器操作系统社区,龙蜥在开源生态建设和治理方面的经验和成果也是可圈可点的。龙蜥社区有着典型的开源治理模式,所有社区角色和管理操作都是透明公开的,社区理事会的全部成员都有公平的机会表达观点,每一项社区角色都有理事会成员共同参与,社区对所有成员也是中立无偏向的。
龙蜥社区从创立之初就积极鼓励创新、充满技术活力,并为来自各行业的技术人才提供了展示才华的机会,向他们提供了丰富的资源和工具,形成了活跃的开源人才生态圈。仅在 2023 年,社区开发者中就有超过 15000 人有代码贡献记录。活跃的开发者氛围为创新打下了坚实基础,龙蜥的每一个发行版都有众多创新特性,反过来也让社区竞争力持续提升。
最后,龙蜥社区的理事成员涵盖了云厂商、芯片厂商、整机厂商、操作系统厂商、电信运营商、互联网服务商、独立软件开发商、系统解决方案提供商等诸多领域,社区成员来自各个行业与细分市场,有力保障了社区的多样与开放性。
在社区的基础治理和协同研发方面,英特尔公司正在龙蜥社区内逐渐转向技术引领者的角色,参加了 50 余个 SIG 中的 20 多个,孵化了很多具有技术领先性和影响力的项目,是社区内影响力最大的厂商之一。2022-23 年,英特尔公司在社区提交的代码约 30 万行,参与维护了四个代码仓库,也在龙蜥社区大会上获得了多个奖项。和英特尔公司一样,其他社区成员也在积极发挥自身优势,努力为社区贡献有价值的代码和项目,对社区事务发表观点,参加社区活动,推动龙蜥社区的技术进步。
目前,龙蜥社区凭借活跃、丰富的开源生态,在国际开源社区中也取得了充足的话语权。社区围绕芯片、内核、编译器、安全、虚拟化及云原生等操作系统核心领域持续进行技术创新,进而推动建立国际范围的技术标准。随着龙蜥社区开源商业模式的不断成熟,越来越多的厂商依托龙蜥社区, 不断推出国产服务器操作系统社区发行版及商业版,满足国产替代多样化需求。在此基础上,开源的参与方企业形成开源 服务的多种 商业模式,加速开源项目的商业化落地,商业上的成功支撑龙蜥社区不断壮大,从而产生更多技术创新,龙蜥社区与商业模式也由此形成了良性循环。
未来,英特尔等社区伙伴将进一步加强对龙蜥社区的技术发展与生态建设的投入,进一步在新技术使能、垂直软件栈集成、用户场景优化、社区最佳实践发布等方面持续发力,支持社区软硬件和应用生态繁荣局面。龙蜥社区正在紧抓国产替代与生成式 AI 浪潮等历史机遇,为中国开源社区基础建设和国产服务器操作系统生态发展作出表率,从而推动全产业数字化进程,帮助更多企业把握智算时代创新脉搏。