《中国开源软件(OSS)推进联盟:2023中国开源发展蓝皮书(294页).pdf》由会员分享,可在线阅读,更多相关《中国开源软件(OSS)推进联盟:2023中国开源发展蓝皮书(294页).pdf(294页珍藏版)》请在三个皮匠报告上搜索。
1、2023 中国开源发展蓝皮书2942023 中国开源发展蓝皮书2942023 中国开源发展蓝皮书编写委员会顾 问:陆首群策 划:刘 澎 孙文龙 赵 琛 蒋 涛 梁志辉 主 编:孟迎霞 武延军 陈 伟 王 伟 耿 航 唐小引 鞠东颖 宋可为 工作组(按姓氏首字母排序):白国华 边思康 程海旭 陈 阳 狄 安 丁 蔚 董世晓 郭 炜 何 苗 郇丹丹 纪明超 姜 宁 荆 琦 李德豪 李光杰 李建盛 梁 尧 刘建珍 刘京娟 隆云滔 罗文江 孙 启 谭中意 滕召智 田 忠 屠 敏 汪 亮 王 庆 王 银 王启隆 王 溯 夏 清 许哲平 杨继国 杨丽蕴 尹 刚 余 跃 岳松颂 张家驹 张 雨 郑伟波 朱其
2、罡2023 中国开源发展蓝皮书2目录概要4总论92023 中国开源发展现状10中国开源发展的机遇与挑战18中国开源发展建议20第一章 开源的基本概念221.1 开源的定义和特征221.2 世界开源发展简史231.3 中国开源发展简史271.4 开源软件与知识产权311.5 开源与标准39第二章 开发者发展现状462.1 开发者规模、增速及发展趋势462.2 开发者对开源社区、活动和项目的投入与贡献542.3 开发者的需求和面临的挑战64第三章 开源项目发展现状683.1 GitHub中国项目活跃度及趋势683.2 基于OSS Compass的国内开源发展现状753.3 中国重点领域开源项目发展
3、现状80第四章 开源行业应用现状1034.1 开源在金融行业的应用1034.2 开源在汽车行业的应用1074.3 开源在工业互联网的应用1114.4 开源在风洞等场景的应用120第五章 开源社区发展现状1235.1 开源社区的起源与发展历程1235.2 开源社区的现状特征1245.3 开源社区发展的挑战和趋势130第六章 开源组织及开源生态发展现状1346.1 开源组织发展现状1342023 中国开源发展蓝皮书36.2 开源组织问题与挑战1536.3 开源组织发展趋势1546.4 开源组织发展建议155第七章 开源教育现状1567.1 开源教育加速融入并贯穿教育全阶段1567.2 开源教育平台
4、和开源协作模式1577.3 校企结合的开源教育协同模式1597.4 开源教育问题与挑战1627.5 开源教育发展建议163第八章 开源商业现状1648.1 开源商业模式1658.2 开源商业现状1688.3 开源支撑的四大业务模型1738.4 开源商业问题与挑战175第九章 中国开源发展的机遇和挑战1799.1 中国开源发展的机遇1799.2 中国开源发展的挑战183第十章 开源贡献19410.1 国际开源社区的中国贡献19410.2 中国企业在开源基金会中发挥重要作用20410.3 中国头部科技企业的开源贡献21010.4 中国原生开源企业加速涌现22310.5 国际机构、国际企业对中国开源
5、的贡献230附录1:开源大事记240附录2:开源专有名词256附录3:开源人物262附录4:开源产品名录266附录5:开放科学和开放获取281致谢2882023 中国开源发展蓝皮书42023 开源蓝皮书概要2023 中国开源发展蓝皮书是由中国开源软件推进联盟(COPU)牵头,联合CSDN、中国科学院软件研究所、开放原子开源基金会等多家企业和机构联合编撰的年度开源报告。2023年,在全世界开源大发展的背景下,中国开源迎来了新的发展高峰,其发展速度仍旧为全球最快,其迸发的活力、潜力和速度已得到全球开源界的认可,中国开源部分领域和部分企业已接近或达到世界先进水平,在国际开源事务中的影响力正与日俱增,
6、发挥着越来越重要的力量。过去的2022年,是中国开源飞速发展的一年,也是中国开源迈向世界开源历史新高度的一年。中国开源开发者、开源项目、开源社区、开源用户数量持续攀升;基金会、知识产权、商业模式、投融资、公共服务平台等开源生态快速完善,繁荣发展。但与此同时,我们也看到,中国开源发展不平衡的特点依然比较明显,与总体发展水平处于第一梯队的美国相比,尚有一定差距。2022-2023 中国开源新发展多年来中国政府始终高度重视开源的发展,随着2021年开源被正式列入国家顶层规划中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要,各地政府和相关部门相继出台开源支持鼓励政策,中国开源发
7、展更是全面进入高速发展阶段。中国开源开发者数量突破800万,居全球第二;年新增数量据全球第二;中国开源开发者正以令人瞩目的速度快速增长。国内开源代码托管平台逐渐形成规模,包括Gitee、GitCode、GitLink、木兰开源社区、Gitlab、Gitea等平台,持续迭代发展。此外,2023年6月开放原子开源基金会发布新的代码托管平台AtomGit,为中国开源基础设施再添新力。以华为、阿里为代表的一大批国内大企业以及PingCAP为代表的部分中国创新企业已进入世界开源领跑者之列;全球开源排行榜中,中国开源活跃度TOP企业分别为:阿里巴巴、百度、蚂蚁集团、PingCAP、腾讯、乐鑫ESPRESS
8、IF、飞致云Fit2Cloud、深度科技Deepin、青云。同时,包括微软、英特尔、IBM、红帽等知名跨国企业在推动中国开源产业发展方面均发挥了非常重要的作用。2022年华人主导的开源项目数量已达2500万个,项目数量与质量双双提升,部分开源项目已进入全球开源项目排行榜前列,包括:PaddlePaddle,TiDB,ant-design,Flink,Pulsar,Doris,esp-idf,tvm,ShardingSphere,DolphinScheduler 等均脱颖而出。2023 中国开源发展蓝皮书5中国开源软件技术深入领域:从操作系统开始,发展到数据库、中间件,并向应用领域逐渐延展,进而
9、在近年来开始主导深度信息技术领域的创新,大数据、云原生、云计算成为最活跃的开源应用领域;人工智能、物联网、元宇宙等新领域,也逐渐拥抱开源并落地开源产品。操作系统上游社区基本成熟:以OpenHarmony、openEuler、龙蜥(Anolis OS)、OpenCloudOS、统信UOS、深度Deepin等为代表的国内力量上游操作系统社区基本成熟且进入生态大发展期。2022年12月ChatGPT的发布引发了新一轮人工智能爆发式增长,包括百度、智源在内的诸多国内企业和研究机构,正全力推进中国大模型底层基础设施的建设。开源技术在中国关键领域和重点行业进一步得到广泛应用,金融电信政务等部分行业处于开源
10、应用进入第一梯队领先态势。在以智能汽车为代表的数字化大发展行业,也成为开源高渗透率的重点领域。在中国成立的开源基金会现有两家,分别为2020年成立的开放原子开源基金会、2023年成立的重庆天工开物开源基金会。开放原子开源基金会现有捐赠单位47家,30个开源项目通过技术监督委员会(TOC)的技术准入,其中OpenHarmony、openEuler两个重点开源项目在业界形成较大影响力。重庆天工开物开源基金会,由重庆市政府批复设立,由清华大学、华中科技大学、重庆大学、中冶赛迪、中国信科、中科院等知名高校和企业联合发起。中国的开源社区从最初单一且独立的社区不断演进,呈现出今天百花齐放、社区规模稳定增长
11、的繁荣景象,为中国开源生态的发展提供了强大的动力。2023年,中国开源组织的数量和质量不断提升,中国开源产业链不断完善。各类型开源组织,包括开源基金会、综合型产业联盟、专业型开源组织、地区型开源组织、开源推广型社会组织等不断涌现,对完善中国开源生态建设发挥着积极的贡献。2022年,中国各大企业纷纷成立开源办公室(OSPO),开源办公室在企业治理中发挥着重要作用:以阿里巴巴、华为、百度、腾讯、字节跳动、蚂蚁集团、中兴、极氪汽车为例,越来越多的企业积极开设开源办公室,成为企业开源统筹和运营的核心能力中心。开源软件供应链标准(SBOM)日益受到重视,COPU牵头组织国内企业代表与国际顶级基金会合力推
12、动企业开源软件供应链安全与发展。中国开源的挑战与不足中国开源生态部分环节仍然薄弱,尤其在开源自主创新、供应链安全、开源社区生态专业治理、开源人才培养以及开放合作扩大国际化影响力等方面仍需加强,如何持续打造开源高地、创新高地、科技高地、人才高地,仍然是中国开源产业的关键课题。2023 中国开源发展蓝皮书6China Open Source Blue Book(2023)SummaryChina Open Source Blue Book(2023)is coordinated by China Open Source Software Promotion Union(COPU),together
13、 with Chinese Software Developer Network(CSDN),Institute of Software from Chinese Academy of Sciences,OpenAtom Foundation and other organizations.In 2023,China open source development remains fast growth and comes to a new height that is recognized from the global level.Some local companies are taki
14、ng leadership roles in open source technologies and segment applications.The influence from China open source communities and the ecosystems is growing significantly and clearly will be continuing.2022 was a year of rapid development for Chinas open source community.The number of Chinese open source
15、 developers,projects,communities,and users continued to rise.The open source ecosystem,including foundations,intellectual property,business models,investment and financing,and public service platforms,has rapidly improved and thrived.However,we are seeing great challenges such as the uneven developm
16、ent of Chinas open source communities in terms of skills,technology and open source governance.There is still a certain gap compared to the global leaders.New Developments of Chinas Open Source Community in 20222023 The Chinese government has always attached great importance to the development of op
17、en source.As a result,the development of open source in China has entered a high-speed phase.The number of Chinese open source developers has exceeded 8 million,ranking second globally.The annual growth rate of Chinese open source developers is also the second highest in the world,growing at an impr
18、essive pace.Domestic code hosting platforms have gradually gained scale,including platforms such as Gitee,GitCode,GitLink,Mulan Open Source Community,GitLab,and Gitea,among others,which have continued to iterate and develop.In addition,in June 2023,the OpenAtom Foundation launched a new code hosting
19、 platform called AtomGit,adding new strength to Chinas open source infrastructure.A large number of companies have become leaders in the global open source community,such as Alibaba,Huawei,Baidu,Ant Group,PingCAP,Tencent,Espressif,Fit2Cloud,Deepin,and QingCloud.Meanwhile,well-known global companies
20、such as Microsoft,Intel,IBM,and Red Hat have been playing important roles in promoting the development of Chinas open source industry.2023 中国开源发展蓝皮书7In 2022,the local-led open source projects reached 25 million,with both the quantity and quality of projects improving.Some open source projects have e
21、ntered the forefront of global open source project rankings,including PaddlePaddle,TiDB,ant-design,Flink,Pulsar,Doris,esp-idf,tvm,ShardingSphere,DolphinScheduler,TDengine,etc.Open source technologies in China have deepened their reach into various fields,starting from operating systems and expanding
22、 to databases,middleware,and gradually extending into application domains.In recent years,China has begun to lead innovation in the field of deep information technology,with big data,cloud-native,and cloud computing being the most active areas of open source application.Technologies such as artifici
23、al intelligence,Internet of Things,and metaverse are also embracing open source and implementing open source with products.OpenHarmony,openEuler,Anolis OS,OpenCloudOS,UOS,and Deepin,which represent popular operating system communities,have entered a phase of rapid ecosystem development.The launch of
24、 ChatGPT in December 2022 has triggered explosive growth in artificial intelligence.The companies and research institutions,including Baidu and Beijing Academy of Artificial Intelligence,are actively promoting the construction of Chinas large-scale model infrastructure.Open source technologies have
25、been widely applied in critical sectors and emerging areas,such as finance,telecommunications,government,intelligent automoibiles,etc.China currently has two open source software foundations:the OpenAtom Foundation established in 2020 and the Chance Foundation established in 2023.The OpenAtom Founda
26、tion has 47 donating members,and 30 open source projects have passed the Technical Oversight Committees technical admission process.The Chance Foundation is jointly initiated by well-known universities and companies.The Chinese open source community has evolved from initial singular and isolated to
27、a vibrant landscape with diverse communities and stable growth,providing strong momentum for the development of Chinas open source ecosystem.In 2023,the quantity and quality of Chinese open source organizations continue to improve,and the Chinese open source industrial chain is continuously improvin
28、g.Various types of open source organizations,including industry open source software foundations,alliances and professional organizations,continue to grow and actively contribute to the development of Chinas open source ecosystem.In 2022,many large Chinese enterprises have established Open Source Pr
29、ogram Offices(OSPOs),which play an important role in enterprise governance.For example,Alibaba,Huawei,Baidu,Tencent,ByteDance,Ant Group,ZTE,and Zeekr motors have all set up OSPOs for coordinating and operating 2023 中国开源发展蓝皮书8enterprise open source activities.The attention to Software Bill of Materia
30、ls(SBOM)is increasing.COPU is promoting the security and development of enterprise open source software supply chains with Linux Foundation and other organizations and enterprises.Challenges and Shortcomings in Chinas Open Source Community Chinas open source ecosystem are still weak in certain areas
31、,especially in terms of open source innovation,software supply chain security,community and ecosystem governance,talent cultivation,and international influence.How to sustainably nurture open source community,innovation,talents,and technology developments remains a key issue for Chinas open source i
32、ndustry.2023 中国开源发展蓝皮书9总论2023年,在全世界开源大发展的背景下,中国开源迎来了新的发展高峰。中国开源的发展速度仍旧为全球最快,其迸发的活力、潜力和速度已得到全球开源界的认可,中国开源部分领域和部分企业已接近或达到世界先进水平,在国际开源事务中的影响力正与日俱增,发挥着越来越重要的力量。回顾过去的2022年,是中国开源飞速发展的一年,也是中国开源迈向世界开源历史新高度的一年。中国开源开发者、开源项目、开源社区、开源用户数量持续攀升;基金会、知识产权、商业模式、投融资、公共服务平台等开源生态快速完善,开源生态繁荣发展。2023年中国开源取得新进展:开发者新增数量排名全球第
33、2,部分中国开源项目已进入全球开源项目排行榜前列;以华为、阿里为代表的一大批国内大企业以及PingCAP为代表的部分中国创新企业已进入世界开源领跑者之列;开源社区、开源人才、开源组织正在蓬勃发展;多年来中国政府始终高度重视开源的发展,随着2021年开源被正式列入国家顶层规划中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要,各地政府和相关部门相继出台开源支持鼓励政策,开源技术在国内关键领域和重点行业得到了极大的推动和广泛应用。中国开源生态正全面进入高速发展阶段。当前,中国开源正处于加速发展阶段,各技术领域如操作系统、数据库、人工智能、云计算等正与开源深度融合,传统行业如金
34、融、电信、医疗、制造业等也正在被开源快速渗透。更重要的是,中国正在成为全球开源市场的增长点,极大的市场容量、完善的产业链、快速的迭代能力正吸引全球的开源项目进入中国。不过,中国开源的高速发展也面临成长的烦恼,如与日俱增的技术风险、法律风险、供应链风险,以及人才危机。但与此同时,我们也看到,中国开源发展不平衡的特点依然比较明显,与总体发展水平处于第一梯队的美国相比,尚有一定差距。中国开源生态部分环节仍然薄弱,尤其在开源自主创新、供应链安全、开源社区生态专业治理、开源人才培养以及开放合作扩大国际化影响力等方面仍需加强,如何持续打造开源高地、创新高地、科技高地、人才高地,是中国开源产业的关键课题。为
35、更准确、客观、真实、完整的展现中国开源发展现状,由中国开源推进联盟(COPU)牵头,联合中国开发者社区CSDN、中国科学院软件研究所、开放原子开源基金会、北京开源创新委员会、开源社、开源中国、北京大学、华东师范大学、国防科技大学等106家单位以及120多位开源专家和志愿者共同协作编撰完成这本2023中国开源发展蓝皮书,力图呈现2023中国开源产业生态全貌、中国2023 中国开源发展蓝皮书10开源在技术创新、产业发展方面的积极进展以及当前所面临的机遇与挑战。在2021、2022年度开源蓝皮书基础上,2023中国开源发展蓝皮书从10个章节分别介绍了开源基本概念、开源开发者现状、开源项目现状、开源行
36、业应用现状、开源社区现状、开源组织及开源生态现状、开源教育现状、开源商业现状、开源发展与挑战、开源贡献,并对中国开源大事记、开源专有名词、开源人物、开源产品库以附录形式作补充说明。值得一提的是,基于本年度中国开源发展的进展,在2022年版本基础上,2023中国开源发展蓝皮书进行了三项改进:1)新增“开源行业应用现状”独立章节;2)新增开源产品库(全球数据库产品库、全球大模型产品库、开源操作系统产品库、主流编程语言库、区块链产品库),并将产品库作为中国开源蓝皮书长期开源项目,在线运营和维护。3)新增开放科学相关介绍。希望2023中国开源发展蓝皮书能够为广大开源从业者、爱好者、用户,以及开源生态建
37、设者、参与者,全面展现当前中国开源发展的全景图。2023 中国开源发展现状2023年,是中国开源大发展的新高峰,中国已成为开源生态发展最具活力和潜力的国家之一,随着国家支持开源发展的政策力度不断加大和深化,开源软件的使用者和贡献者数量持续增长,开源社区的规模和活跃度不断扩大,开源组织的数量和质量持续提升,开源技术在关键领域和行业得到更深入和广泛的应用,中国开源与及国际开源界的交流合作也在不断深入推进,同时,开放科学的发展,也让开源从单纯的代码开源,扩展到数据开源、算力开源等范畴,所有的新进展,都为中国开源生态系统快速发展注入了强大的动力。中国开源的快速发展,得益于几个重要的前提背景:第一,根据
38、Github中国开发者注册用户数量以及中国开发者的总和推算,中国已拥有全球最大规模的开发者群体,这是中国开源发展的根本动力引擎;第二,中国已成为世界最大的开源应用市场,涌现了大批超级用户,为开源技术的成熟演进做出了卓越贡献。第三,中国已经成为全球开源的智库高地。中国开源软件推进联盟的国际智囊团多年来聘请了几十位全球顶级开源专家,以多种形式参与和推进中国的开源建设,是开源界公认的顶级智库。为了完整全面的呈现中国开源产业生态全貌,全书从开源生态的构成要素现状逐一阐述:从最基石的开发者、开源项目、开源社区,到包括基金会在内的开源组织和生态、开源教育,再到开源商业模2023 中国开源发展蓝皮书11式的
39、发展。中国开源自主创新的成功,离不开政府对开源的大力扶持,离不开优秀开源领袖、大型企业、开源基金会、大型投资机构对开源的投入,以及所有开源生态参与者与个体开源爱好者的贡献。一、中国开源在国际开源界的地位和语话权持续提升2004年,在政府相关部门指导下,中国开源软件推进联盟(China OSS Promotion Union,缩写 COPU)在北京成立,作为中国第一个专业权威的开源组织首次站在了国际开源舞台上,同一年,发起召开中日韩三国IT局长OSS会议暨东北亚开源软件推进论坛,至今已举办19届。2006年,中国开源软件推进联盟主办了首届“开源中国开源世界高峰论坛”和“圆桌会议”。自此,已连续1
40、6年作为每年标志性的重要开源活动。伴随首届“开源中国开源世界高峰论坛”和“圆桌会议”,中国开源软件推进联盟聘请了世界著名的开源领袖、大师、著名开源基金会主席、跨国企业开源高管等担任中国开源软件推进联盟智囊团(Think Tank)高级顾问。首届智囊团20人,包括Linux基金会执行董事Jim Zemlin;Linux内核开发大师兼2.6版本监护人Andrew Morton;Apache创始人Brian Behlendorf;MySQL创始人David Axmark;Ubuntu创始人Mark Shuttleworth;开放源码促进会(OSI)主席Michael Tiemann;Source F
41、orge创始人Larry Augustin;自由软件基金会(FSF)的Eben Moglen;IBM Linux技术中心(LTC)副总裁Daniel Frye博士;英特尔开源技术中心(Intel OTC)总监Dirk Hohndel;Jboss创始人Marc Fleury;Gnome基金会(Gnome Foundation)主席Dave Neary等。到今天智囊团已发展到60多人。这是中国开源软件推进联盟很早就创建的开源高地、创新高地、科技高地、人才高地!中国开源高地的创立,吸引了全球开源大师、开源组织和机构对中国开源的重视与投入,众多全球知名开源组织(如Debian、Linux、Apache
42、、FreeBSD、Ubuntu、Mozilla等)及28家跨国公司(包括IBM、HP、Intel、Google、SUN、Oracle、Motorola、Nokia等)等相继申请加入。多年来,中国开源高地为提高中国开源的话语权,加速中国开源发展、扩大中国开源在世界上的影响,打下了深厚的基础。Linux基金会执行董事Jim Zemlin曾在2021中国开源发展蓝皮书中评价:中国开源发展很快,如今已接近或达到世界先进水平,一些企业开始进入世界领跑者行列,还涌现出杰出的开源领袖。期望中国在开源的教育、标准化、立法、知识产权保护,以及开源社区、基金会、风险投资等建设方面,基于已取得的较大进步更上一层楼。
43、2023年,中国开源迎来了新的发展高峰。中国开源开发者、开源项目、开源社区、开源用户数量持续攀升;基金会、知识产权、商业模式、投融资、公共服务平台等开源生态快速完善,尽管其中还有不2023 中国开源发展蓝皮书12少待改进和完善处,但中国开源爆发出来的活力、潜力和惊人的加速度已经成为全球开源界的共识,在国际开源界的地位和话语权持续提升。以华为、阿里为代表的一大批国内大企业以及PingCAP为代表的部分中国创新企业已进入世界开源领跑者之列;全球开源排行榜中,中国开源活跃度TOP企业分别为:阿里巴巴、百度、蚂蚁集团、PingCAP、腾讯、乐鑫ESPRESSIF、飞致云Fit2Cloud、深度科技De
44、epin、青云。同时,包括微软、英特尔、IBM、红帽等知名跨国企业在推动中国开源产业发展方面均发挥了非常重要的作用。中国在国际开源的地位和话语权,更多是由数字背后的中国开源人持之以恒的努力和奉献赢得。华为、阿里、百度、腾讯、中兴、字节跳动、滴滴、小米等国内头部科技企业积极投身开源项目贡献与社区治理、生态共建,麒麟软件、统信软件、平凯星辰、Kyligence、涛思数据等多家科创领域新秀脱颖而出,表现不凡,正是每一家企业和学、研机构的积极投入和踊跃参与,才使得中国在世界上的开源贡献度不断攀升。中国开源的发展也少不了跨国企业的贡献。包括微软、英特尔、IBM、红帽等知名国际技术公司在推动中国开源产业、
45、中国开源项目与技术的发展和应用、开源人才、开源社区发展、开源国际性交流与助力等方面均发挥了非常重要的作用。二、中国开源最大的活力来源于数千万开发者,开发者增长速度令人瞩目中国开源开发者数量突破800万,居全球第二;中国开源开发者年新增数量据全球第二;中国开源开发者正以令人瞩目的速度快速增长。开源新生力量偏向年轻化,增长空间和潜力巨大。中国开发者社区CSDN 2022年度数据显示,中国开发者注册用户数4300万中,2022年新增用户600万,其中新增用户中60%为大学生和高中生,高校计算机专业学生覆盖度90%。随着开源的普及,很多年轻开源新生军逐渐加入和成长,开源人才增长空间和潜力巨大。全国超过
46、40%的开发者工作在一线城市(其中以北京、上海、广州、深圳为主)。北京、广东是开源开发者聚集较多的地域,占全国总数28.2%。上海、江苏地区占比数量处于第二梯队,占全国总数15.1%。开源正在吞噬世界,在日常的开发工作中,96%的开发者正在使用开源软件,仅有2%的开发者表示从未使用开源软件。2023 中国开源发展蓝皮书13开发者中,49%的开发者参与过开源项目,接近一半的开发者加入了开源的大队伍。参与开源项目的开发者中,67%的人员表示每周在开源上投入的时间不超过5小时,4%的开发者每周在开源上投入超过30小时以上。在开源项目的贡献上,开发者主要还是通过代码和文档的贡献,在参与过开源项目的开发
47、者中,有72.9%的开发者有代码贡献,49%开发者有文档贡献。国内的开源项目与社区中,QQ群、邮件列表、微信为最主要的三大交流工具。三、中国开源项目稳定发展,部分企业表现抢眼,但中美仍有不少差距据GitHub统计,近5年全球开源总体活跃仓库数量保持着约24%左右的增速,中国在2022年的开源日志事件和活跃仓库数也均有明显增长。中国大企业开源的项目体量及活跃度总量,与美国大企业相比,还是有不少的差距。全球排名第一的企业为微软公司,活跃项目数7629,年度活跃度82万,项目平均活跃度108;中国排名第一的企业为阿里巴巴,活跃开源项目数2635,年度活跃度10.3万,项目平均活跃度39。全球开源排行
48、榜中,中国开源活跃度TOP企业分别为:阿里巴巴、百度、蚂蚁集团、PingCAP、腾讯、乐鑫ESPRESSIF、飞致云Fit2Cloud、深度科技Deepin、青云。华人主导的开源初创企业和项目表现抢眼,从项目平均活跃度,可以看到PingCAP(tidb,tikv)、ESPRESSIF(esp-idf)、StarRocks(StarRocks)均脱颖而出。中国开源软件的发展从操作系统开始,发展到数据库、中间件,并向应用领域逐渐延展,进而在近年来开始主导深度信息技术领域的创新,开源正在与各技术领域深度融合。其中,数据库、云原生与开源项目的结合最为紧密,操作系统领域也出现大量成熟的Linux发行版,
49、很多企业开始自研开源的实时操作系统。在新技术领域,人工智能、物联网、元宇宙等技术也逐渐拥抱开源并落地开源产品。中国高度重视各个技术领域在开源方向的前瞻性布局,无论是项目活跃度,还是项目影响力,都在快速提升。在数据库领域,开源展现出两大趋势。一是国产商业数据库逐渐走向开源,其中华为的openGauss、阿里云的PolarDB、奥星贝斯的OceanBase等,开始致力于为国内数据库行业构建基础根技术和根生态;二是中国在分布式、实时数仓等方向的开源产品已经成为了全球范围内的优秀项目,如PingCAP发起的TiDB、百度发起的Doris和由国人开发的在Apache基金会孵化毕业的HAWQ项2023 中
50、国开源发展蓝皮书14目等。在人工智能领域,深度学习已经是技术创新与开源落地的主要方向。2022年12月ChatGPT的发布引发了新一轮人工智能爆发式增长,中美在大模型领域将掀起新一轮人工智能竞争热潮,包括百度、智源在内的诸多国内企业,将持续推动中国大模型底层基础设施的建设。2022中国开源贡献度报告显示,国际开源Top50项目中,中国只有ant-design和vue-element-admin两个项目上榜,排名17和26,均为前端项目,主流开源项目中国内仍然较少,中国在开源根技术和核心开发工具方面仍很薄弱。2023年2月,由开源中国、华为、南京大学等机构联合发布开源指南针(OSS Compas
51、s)平台,面向 GitHub、Gitee等托管平台上托管的所有开源项目开放,为国内和国际开源社区提供了SaaS服务,为中国开源社区的健康指标和结果评估提供量化指标。四、开源在传统行业的应用进一步深化,金融电信政务等部分行业处于第一梯队领先态势开源在各行业的渗透率正在逐渐加深。据红帽发布的报告显示,当前已经有超过90%的IT领导者都在使用企业级开源。同时数据显示,国内超过八成的行业客户都在软件开发生产中使用到了开源技术。据开源在传统行业的应用统计,金融、电信、政务、医疗行业占比最高。其中,金融行业占比17.3%,电信行业运营商占比10.9%,医疗行业占比为9.6%。以开源操作系统openEule
52、r、企业级Kubernetes平台OpenShift等为例,其主要应用场景分布在金融、运营商、政府、物流、制造等场景。开源在以智能汽车为代表的数字化大发展行业,将成为开源高渗透率的领域。以宝马为例,在多年前就成立了自动驾驶项目,并将开源作为重点推进,核心在于使用开源能够推进开发更加敏捷高效,同时对系统的稳定性及安全大有裨益。开源正在渗透行业,同时行业也在反哺开源,其中尤以金融和电信行业为甚,近年来涌现了诸多非常优秀的开源项目。金融行业以微众银行为代表,已发起二十余个开源项目,其中两个已于2021年进入Apache孵化器。电信行业中,以中国移动为代表的中国运营商与海外企业合作,参与推动了包括ON
53、AP、Edge、G-SRv6等基于平台、关键部件、系统与集成领域的开源项目。在开源社区与组织建设方面,金融、电信、制造业、智能汽车等已形成行业特色。行业开源社区及组织主要承担行业内的开源代码服务、供需对接、开源治理推动、开源规范制定、开原生态建设及企业2023 中国开源发展蓝皮书15交流等工作,极大地推动了各行业开源协作和开源实践。例如,金融行业开源技术应用社区、工业技术软件化开源社区(OSIICN)、通信行业开源社区(ICTOSC)、OpenSDV汽车软件开源联盟等等。可以预见,行业正在逐渐形成拥抱开源、使用开源的共识。未来,开源将在传统企业展现更多的力量,而传统行业积极拥抱开源、引入开源软
54、件的背后,是其业务发展导致的企业对持续变化的业务需求响应能力、软件性能及成本与效率方面的考虑,降低成本、提升效率和创新发展。开源技术将以更加深入地融入各个行业,推动数字化转型和智能化升级。五、开源社区蓬勃发展,但运营和治理的专业化程度仍需提升中国的开源社区从最初单一且独立的社区不断演进,呈现出今天百花齐放、社区规模稳定增长的繁荣景象,为中国开源生态的发展提供了强大的动力。国内开源代码托管平台逐渐形成规模,包括GitCode、Gitee、GitLink、木兰开源社区、Gitlab、Gitea等平台在内,持续迭代发展。此外,2023年6月开放原子开源基金会发布新的代码托管平台AtomGit,为中国
55、开源基础设施再添新力。项目型开源社区大量涌现。根据开源社汇总的中国开源地图,2022年中国开源社区新增21个组织,增幅明显。按地域排序,开发者社区聚集最多的前三位地区为北京、上海、杭州。北京地区共有69个社区,包括Apache IoTDB、开源GitOps产业联盟、Apache ShardingSphere、Apache Doris、亚马逊云科技、OceanBase等。上海开源社区包括KubeSphere、Neo4j开发者社区、OpenMLDB社区、X-lab开放实验室等;杭州开源社区有Apache RocketMQ、阿里云PolarDB开源社区、Ruby China、龙蜥社区、KubeEdg
56、e等。大数据、云原生、云计算为专业开源社区排名最多的3个领域,中间件、机器学习、数据库社区数量近几年增长迅速。大数据在开源社区领域的类别中数量最高,有46个。一方面,在数字化时代,大数据发展起步较早,行业对大数据技术和工具的需求非常高;另一方面,大数据领域的技术非常复杂,涉及到分布式计算、数据存储和处理乃至机器学习等多个方面,这也涌现了Hadoop、Spark、Kafka等成熟的技术工具和框架。云原生和云计算开源社区数量排在第二和第三位,分别有43个和39个。中间件、机器学习、数据库的社区数量在近几年增长迅速,如今均达到了31个。2022年,国内举办了多场开源社区活动和会议,为开发者提供了学习
57、和交流的机会。比较有影响力2023 中国开源发展蓝皮书16的会议包括:开放原子全球开源峰会、中国开源年会(COSCon 2022)、CCF中国开源大会、长沙 中国1024程序员节、全球开源技术峰会GOTC等。中国开源社区与国际交流更为紧密:中国开源社区积极参与国际开源项目,共商开源供应链安全策略,中国的开源项目和开发者在国际开源社区中逐渐脱颖而出,中国举办的开源技术大会和交流活动,吸引了来自世界各地的开源爱好者和专业人士。六、开源组织数量和质量不断提升,对开源生态建设发挥着重要推动作用2023年,中国开源组织的数量和质量不断提升,中国开源产业链不断完善。各类型开源组织,包括开源基金会、综合型产
58、业联盟、专业型开源组织、地区型开源组织、开源推广型社会组织等不断涌现,对完善中国开源生态建设发挥着积极的贡献。专业型开源组织,例如在国际上颇具影响力的中国开源软件推进联盟(COPU),倡导发展开源芯片的中国开放指令生态(RISC-V)联盟和中国RISC-V产业联盟,关注开源人工智能等的新一代人工智能产业技术创新战略联盟,聚焦工业4.0的开源工业互联网联盟,着力于云计算产业的中国开源云联盟、云计算开源产业联盟等,都彰显了中国开源生态蓬勃发展的生命力。中国开源基金会新进展:2020年6月成立的开放原子开源基金会,是我国首家开源基金会。现有捐赠单位47家,30个开源项目通过技术监督委员会(TOC)的
59、技术准入,其中OpenHarmony、openEuler两个重点开源项目在业界形成较大影响力,累计数亿人次、数百万用户企业通过网络免费获取。2023年4月成立的重庆天工开物开源基金会,由重庆市政府批复设立,由清华大学、华中科技大学、重庆大学、中冶赛迪、中国信科、中科院等知名高校和企业联合发起。以华为、阿里巴巴、字节跳动、蚂蚁集团、中兴、极氪汽车为例,越来越多的企业积极开设开源办公室,成为企业开源统筹和运营的核心能力中心,专业合规地运营开源,并在开源社区贡献代码、资源和经验,大大推动企业开放组织和繁荣开源生态的发展进程。中国开源生态的蓬勃发展,不仅对于中国的技术创新和产业发展具有重要意义,对于全
60、球的开源生态同样产生了积极的影响。七、开源教育横纵连合协同发展,人才培养规模化稳步推进国内众多高等院校加大开源基础设施投入力度,进行开源课程建设,组织开源相关讲座、竞赛以及2023 中国开源发展蓝皮书17多种线上、线下活动,积极探索开源创新人才培养路径,提升软件人才与关键软件技术创新和供给能力。北京大学计算机学院周明辉开设OSS Development开源软件技术课程,华东师范大学与同济大学共同创建X-lab开放实验室,开设开源软件通识基础课程,等。知名开源项目及开源企业纷纷组建专门的技术培训学院,发布开源培训认证课程,围绕开源项目推动专业化教育,如百度AI Studio、PingCAP Ti
61、DB培训及认证课程等。基于开发工具和知识社区的开源教育平台快速发展,形成了活跃的互动在线学习与实训模式。国内平台类典型代表包括 CSDN GitCode、GitL、木兰开源社区、头歌()、G 等社区,为全球开源学习者提供学习实践的通道。开源教育正加速融入并贯穿教育全阶段:开源逐渐渗入各地高、中、小学教育,像Arduino、Scratch等开源软硬件在儿童创客教育产品中被广泛使用,众多开源组织和开源在线教育平台组织师资培训及学生创客活动,支持学校进行开源启蒙教育。同时,越来越多的职业教育机构和培训机构,大量引入和增设开源软件和工具、开源相关培训及网络课程。政产学研用,多方协同,从开源文化、开源素
62、质、开源技能“三位一体”协同培养,构建开源教育的生态发展。2023年中国计算机教育大会上,由教育部、CCF开源发展委员会、软件行业协会、开源基金会等多方一起,探讨大规模计算机实践教育资源共建共享方法及流程,支持高校加速推进计算机开源人才培养体系建设,从规模化人才培养方面赋能发展。但开源教育快速发展的同时,当前市场仍存在开源人才短缺,开源教育资源不完善;高校对开源教育的接受程度有限、开源教育缺乏可持续发展的商业模式等等问题与挑战。八、开源商业:开源商业模式逐渐演进成型,投融资偏好人工智能热点开源作为多年来长盛不衰的话题,在全球范围内,已经有越来越多的开源项目公司获得大量投资或最终上市。而在此过程
63、中,开源的商业模式也逐渐成型,演进出多种商业模式。2022年对于开源商业化来说称得上是极具挑战的一年。无论在全球资本市场上,还是在国内市场上,由于Covid-19疫情的影响以及全球政治形势的影响,经济的缓慢复苏和资本的骤冷,让开源生态里的商业公司都经历着各种考验。全球市场上,2022年有MariaDB(MySQL之父Monty创建)通过SPAC方式上市,但不到半年的时间市值腰斩。在国内市场上,相比资本市场的谨慎观望,国家和政府则对于开源逐渐重视,并不断推出利好政策。2023 中国开源发展蓝皮书18与过去两年相比,开源投融资的赛道发生显著的变化,从数据库为先转为人工智能为先。就国内市场而言,大模
64、型的火热带动了Mengzi(澜舟科技)、ChatGLM和CodeGeeX(智谱 AI),而面向AI的向量数据库 Milvus(Zilliz)也迎来了前所未有的机遇。当前,开源商业化依然面临着极大的挑战,开源项目的贡献方、拥有方、开源社区力量、基金会或者OSI等行业非政府组织以及政府最终相互结合起来,形成了对于整个开源世界的运作和治理控制体系及至关重要的奖惩执行。中国开源发展的机遇与挑战中国开源发展的机遇开源正成为全球数字市场的增长点,我国政府更加重视与推动开源的发展:开源软件以前所未有的力量推动全球创新和经济增长,世界各国纷纷将数字经济作为重要的发展战略,我国政府对开源技术的支持力度也在不断加
65、大,从国家层面、省市及地区相继出台政策,引导和投资促进开源技术在关键领域的应用和发展,支持开源社区的建设和国际合作,推动中国开源走向全球。政府对开源的支持促进了开源生态系统的繁荣,并为开源软件在国内的广泛应用创造了条件。中国具有极大的开源应用市场空间:中国拥有全球最完善的电子工业产业链,许多开源技术在中国市场找到载体落地并销往全球。开源技术本地化,并在本地提供服务和二次开发的过程,是一个明显的趋势,RISC-V、TWS(True Wireless Stereo)等技术在中国的快速产业化就是最佳案例。特别是软件、硬件结合的产品及软硬一体化的应用解决方案,依托中国完备、高效的产业链优势,这是中国开
66、源发展在全球市场占据领先地位的历史机遇。而随着IoT和AIoT的发展,数据将从万物互联中产生。中国制造业的市场规模与快速迭代的优势,将带来更多的技术创新。开源的订阅服务费的商业模式和可定制化的开放技术架构为中国企业降低了市场门槛与学习成本,提升了性价比。据2022年中国开源软件产业研究报告的数据显示,开源可为企业项目节省38%的直接开发成本,避免重复造轮子的成本投入。开源正与各技术领域深度融合:开源软件的发展从操作系统开始,发展到数据库、中间件,并向应用领域逐渐延展,进而在近年来开始主导深度信息技术领域的创新,开源正在与各技术领域深度融合。开源逐步渗透传统行业:开源在各行业的渗透率正在逐渐加深
67、。据红帽发布的2021全球企业开2023 中国开源发展蓝皮书19源现状报告显示,当前已经有超过90%的IT领导者都在使用企业级开源。同时,据数据统计,2020年在全球财富50强中,共有72%的企业在使用GitHub平台托管代码,国内超过八成的行业客户都在软件开发生产中使用到了开源技术。中国具有极大的开发者人才基础:据CSDN数据显示,当前中国开发者用户已超过4300万,2022年新增600万开发者相关用户,其对开源相关技术的关注度和学习热情持续高涨,这数千万的开发者群体为中国开源事业提供了源源不断的动力和创新能力,成为推动中国开源发展的重要基础力量。中国开源发展的挑战高质量开源项目仍然缺乏:尽
68、管中国的开源项目数量不断增长,但仍面临高质量开源项目的相对匮乏,尤其是根技术和核心技术栈工具的缺乏。在全球开源竞争中,仍然需要持续加强创新能力,培育更多具有核心竞争力的开源项目,提升开源软件的质量和可靠性。顶尖开源人才匮乏,规模化开源人才培养生态还待发展:优秀开源人才所带来的生态效应,是非常稀缺的资源。但当前开源人才供需对接的效率低;高技能人才匮乏,顶尖开源人才更难寻;同时企业对开源人才的培养成本投入少,开源人才留存困难等问题。开源供应链安全、知识产权合规及法律风险问题,日益突出:开源软件漏洞数量保持高位的情况下,随着开源应用的增加,加强开源安全解决方案的研发和应用,提升开源软件和系统的安全性
69、,建立健全的开源治理机制和规范是一大挑战。同时,开源软件的使用和贡献涉及知识产权和法律合规等问题,如何更好地保护知识产权,合规地贡献、使用和贡献开源代码,也是是一大挑战。开源社区的治理和协作,需要提升系统化建设能力:随着开源社区规模的不断扩大,社区治理和协作机制的建设变得更加重要。加强开源社区的组织和管理,建立有效的决策机制和协作平台,促进社区成员之间的合作和交流,提高社区的活跃度和效率。国际竞争和合作压力:中国开源界面临来自全球其他国家和地区的竞争和合作压力,在全球开源领域,各国都在积极推动开源技术的发展,中国需要与其他国家开展更加广泛和深入的合作,加强国际交流与竞争,提升中国开源在全球的影
70、响力和竞争力。中国开源发展建议一、持续加强重点开源人才培养,推动开源教育和人才基础2023 中国开源发展蓝皮书20加强开源教育和人才培养,加大对开源教育、开源培训的投入,建设开源教育资源和平台,全方位完善开源人才教育体系。鼓励开源产教融合、科教融合的高效协同教育机制,持续打造创新型产教融合平台,鼓励开放融合、参与开源实践。加大开源知识库和资源库的建设,通过提供培训、指导和资源的方式,鼓励和支持中国开源开发者积极参与和贡献到全球主流开源项目中,帮助中国开发者融入全球开源社区。加强开源文化的宣传与推广力度,提高开发者对开源的认知,鼓励举办开源活动、开源研讨会和开源培训、实训营等平台,提高开发者的开
71、源意识和技术能力,推动开源文化的普及和传播。进一步加大开源创新大赛等的奖励和扶持、优秀开源人才的培养计划。二、加大对开源项目和源企业的投入与扶持,鼓励新创开源项目,提高中国开源影响力鼓励企业和政府机构参与开源项目的投入,加大对开源组织和企业的投入与扶持,提高开源项目的质量和数量,为国内外用户提供更好的开源产品和服务,让更多的用户使用中国主导的开源项目。支持开源创新和项目孵化,持续打造高质量的开源项目:鼓励和支持创新型开源项目的孵化和发展,提供资金、资源和政策支持,培育更多有国际影响力的开源项目,推动中国开源在全球的竞争力。加大对开源托管及运营基础平台的投入,加大对支撑型代码托管平台以及开发者平
72、台的支持与扶持,对持续打造有国际竞争力的支撑平台具有非常重要的意义与价值。三、继续深化开源生态发展,推动开源产业化的可持续发展。加强对开源社区的扶持和治理,保障开源社区的稳定和可持续发展。鼓励开源项目的商业模式和产业化路径发展,加强产业上下游戏的的对接和合作,深化更好的技术支持和应用场景,推动开源技术在产业领域的应用和发展。扶持开源企业发展,培育优秀开源项目。从开源产品的诞生到商业化,往往要经过很长的周期。建议政府部门对开源项目、开源产品和开源企业给与较长期支持。例如,鼓励各行业企业积极拥抱开源,出台相关支持政策,引导企业采用开源产品,扩大开源用户群体等。四、推动开源供应链安全及知识产权保护2
73、023 中国开源发展蓝皮书21积极参与国际开源标准制定,推动开源技术的标准化进程,提高中国在国际开源社区的话语权和影响力,为中国企业在全球开源领域的竞争提供有力支持。强化知识产权保护:加强对开源软件知识产权的保护和管理,建立健全的法律法规和制度,确保开源软件的合法权益,增强开源社区和企业的创新动力和信心。五、加强国际交流与合作,加大力度促进开源国际化合作,提升国际化影响力进一步扩大中国开源与国际的交流与合作,鼓励参与国际开源项目、开源社区、开源组织和标准的制定。鼓励多形式与国际开源建立合作关系,促进技术共享与合作,推动形成统一融合的开源生态。鼓励中国开源国际化,积极参与全球竞争。数字经济快速发
74、展,中国的规模化场景有机会诞生更多世界级的基础软件公司。开源能吸引全球人才、汇聚全球场景、快速打磨产品,在技术变革日新月异的今天,为中国企业超越传统巨头提供了可能。借助开源“全球化”的天然属性,中国开源企业有能力参与全球竞争,建议政府鼓励更多的中国开源企业走向世界,并提供相应的政策支持。鼓励国外优秀开源项目和优秀人才引进来:吸收和借鉴国际先进经验,加强与国际开源组织和社区的交流合作,吸引全球优秀项目与杰出开发者加入,提升中国开源在国际舞台上的影响力和竞争力。正如中国开源推进联盟名誉主席陆首群所言,在国际形势愈发复杂的背景下,中国开源发展的核心是自主创新。中国开源社区要加强原创性的技术研发,推动
75、自主知识产权发展,以实现关键技术领域的自主可控。中国开源人和开源组织更应该不忘初心、坚守本心,坚守并践行中立原则的开源发展之路,推动中国科技及全球开源的大发展。中国开源的发展,未来可期!2023 中国开源发展蓝皮书22第一章 开源的基本概念1.1 开源的定义和特征1.1.1 开源的定义开源(Open Source)一词于1998年2月3日由Chris Peterson提出,“Open Source”的概念出自当时著名的黑客(Hacker)社区Debian的社长Bruce Perens起草的“Debian Free Software Guidelines”(DFSG)。1998年2月下旬,Eri
76、c Raymond和Bruce Perens共同创立Open Source Initiative(OSI)。OSI承担的首要任务之一是起草开源定义(OSD),并使用它来开始创建OSI批准的许可证列表。对确立“Open Source”定义有决定意义的是在1998年4月7日在美国加州Palo Alto由18位“自由软件运动领袖”召开的Freeware高层会议,通过了传播开源的必要性。会议由Tim OReilly主持,Brain Behlendorf(Apache创始人)、Linus Torvalds(Linux创始人)、Guido Van Rossum(Python创始人)、Eric Raymon
77、d(著名记者、OSI首届主席)等参加。随着时代的变迁,开源的定义内涵也在不断演进。目前的共识是:开源是促进信息技术创新的重要途径,是将源代码、设计文档或其他创作内容开放共享的一种技术开发和发行模式。技术领域的开源已包含源代码+软硬件设计文档源代码、源数据等技术和资源的开放共享,源代码仍然是开源的主要内容。在开源模式下,通过许可证的方式,使用者在遵守许可限制的条件下,可自由获取源代码等,并可使用、复制、修改和再发布。本质上,开源模式是一种依托互联网平台,大规模群体智慧通过共同参与和协作,不断累积智慧,实现持续创新的方法。该方法中,项目的核心开发人员与大规模的外围群体紧密合作,他们通过互联网来共享
78、资源、开展协同开发、管理代码等,由此使得项目开发的效率、应对需求变化的能力大幅提升。1.1.2 开源的特征中国开源软件推进联盟于2016年归纳提出的(已被国际认可)开源特征包括:开放、创新、自由、共享、协同、绿色、民主(化)。开源的本质在于开放、共享、协同。2023 中国开源发展蓝皮书23开放指开放标准、开放环境、开放源码;创新是主轴;自由指自由发布、自由传播、自由复制、自由修改、自由使用,其中,自由传播是开源运动的要义;共享指共享资源;协同指协同开发、协同作业、协作生产;绿色指支持绿色可再生能源、绿色环境和零边际成本效应;民主化指在新兴协同共享中,创新和创造力的民主化正在孵化一种新的激励机制
79、,这种机制很少基于经济回报,而更多地基于推动人类的经济生活方式,缩小收入差距,实现全球民主化。为避免原创技术的流失,不能单纯限制孵化阶段开源代码的自由传播,可通过开源的商业模式、安全模块、运维举措、生态系统所构筑的屏蔽层来解决。作为一种创新协作模式,开源已经不仅仅是开放源代码的软件技术开发,还包括更为广泛的开放技术领域及协同创新的理念与机制,总体包括开放科学、开源软件、开源硬件、开源技术、开源文化、开源经济等。“互联网基于知识社会的创新 2.0”是开源创新的基础理论(2005年由中国开源软件推进联盟提出,后来获得全球开源界领袖们的确认),与工业 4.0、工业互联网机制相通,与元宇宙(Metav
80、erse)概念相似。利用开源渠道,将高阶社会(知识社会,虚拟化的实验空间)中的技术、管理、资源等要素,作用于低阶社会(现实的工业社会,物理空间)中的业态(生产的、技术的、经济的、社会的),促使其产生01的爆发性重构。1.1.3 开源的范畴时至今天,开源已成为开源软件、开源硬件、开源生态、开源技术、开源社区、开源经济、开源商业模式、开源理念、开源文化、开源教育、开源许可证、开源基金会、开源孵化器、开源数字化治理体系、开源标准等的总称。1.2 世界开源发展简史世界开源发展史,有三个里程碑时间节点:1970年、1985年、1991年,分别对应UNIX、GNU、Linux的发展。2023 中国开源发展
81、蓝皮书241.2.1 UNIX简史1969年之前,Bell实验室和MIT、GE合作启动开发一个多任务多用户的操作系统Multics,为UNICS操作系统诞生创造条件。1969年,UNIX原型UNICS(UNiplexed Information and Computing System)诞生。1973年,Dennis Ritchie发明C语言,用C语言将UNICS重写并更名为UNIX,UNIX正式诞生。1969-1977年,UNIX相继推出V1-V6版本,向社会开放源代码。1977年开始进入“后UNIX”时代,UNIX演化为UNIX(闭源,即AT&T-UNIX)和BSD(开源,即BSD-UNI
82、X)。主流的开源BSD操作系统有386BSD、FreeBSD、NetBSD、OpenBSD。因此,世界开源的历史始自1970年开启的“前UNIX”,至今53年,开源在事实上已经历了半个世纪的发展历程。1.2.2 GNU简史GNU系统是一套向上兼容UNIX的完全自由的操作系统。GNU代表“GNUs Not UNIX”。1983年9月27日,Richard Stallman提出了GNU工程的初始声明,意图找回在早期计算机社区中广泛存在的合作精神,通过除去专属软件所有者设置的障碍而使得合作再次成为可能。1984年1月,Richard Stallman从MIT离职并开始编写GNU软件,同年9月开始GN
83、U Emacs的工作。1985年,Richard Stallman发表GNU宣言,吸收“前UNIX”和BSD的开源成果,开发推出Emacs等编译器等自由软件(Free Software)。同年10月,自由软件基金会(FSF)正式成立。“Free Software”中的“Free”关乎自由,而不是价格,是指可以付费或不付费得到GNU软件。一旦得到了软件,便拥有了使用它的四项特定自由。可以自由按照自己的意愿运行该软件;可以自由复制软件并将其送给朋友和同事;可以自由通过对源代码的完全控制而改进程序;可以自由发布改进的版本从而帮助社区建设。1.2.3 Linux简史Linux的诞生、发展和成长过程始终
84、依赖着五个重要支柱:UNIX操作系统、MINIX操作系统、GNU计划、POSIX标准和Internet网络。2023 中国开源发展蓝皮书251977年,UNIX的重要分支BSD在UC Berkeley诞生。开发者是SUN公司创办者Bill Joy。1984年,Andrew S.Tanenbaum为能续进行学术教育研究,重新开发了一个基于“前UNIX”和BSD4.3的开放源代码操作系统Minix,这是Linux最开始的前身。1985年,GNU开源计划和FSF基金会成立。在这个时间前后,涌现了很多重要的软件和协议,如GPL协议、GCC C编译器、Emacs编辑器、Glibc、bash shell等
85、,为Linux后来的发展创造了肥沃的土壤。1991年,芬兰本科生Linus Torvalds在Minix和GNU成果的基础上,开发并以GNU GPL许可方式发布了开放源代码操作系统Linux v0.01。1992年5月21日,Peter MacDonald发布第一个独立的Linux安装包SLS。1993年6月17日,Slackware Linux由Patrick Volkerding发布,这是第一个取得广泛成功的Linux发行版。8月16日,Ian Murdock(Debian中的“ian”)发布了第一个Debian Linux发行版。Debian是最有影响力的Linux发行版之一,是MEPI
86、S、Mint、Ubuntu等的鼻祖。8月19日,Matt Welsh写的Linux Installation and Getting Started第1版出版,这是第一本关于Linux的书籍。1994年3月14日,Linux内核V1.0发布,它支持基于i386单处理器的计算机系统。8月15日,William R.Della Croce,Jr.申请了“Linux”商标,9月进行了注册。11月3日,Red Hat共同创始人Marc Ewing宣布可以以49.95美元的零售价格获得Red Hat Software Linux的CD-ROM和30天的安装支持。1996年5月9日,吉祥物Tux诞生。6月
87、9日,Linux内核V2.0发布,这是第一个在单系统中支持多处理器的稳定内核版本。Linux从此成为很多公司的重要选择。10月14日,Mattias Ettrich发起KDE项目,此前UNIX和Linux都没有统一的桌面系统,编写桌面软件非常复杂。1997年1月9日,第一个“Linux病毒”Bliss被发现。1998年5月1日,基于Linux的Google搜索引擎面世。12月4日,IDC报告称1998年Linux出货量至少上升200%,以其他任何操作系统无法企及的速度增长着。1999年3月3日,GNOME桌面系统进入Linux世界。2000年2月4日,IDC报告表明Linux排在“最受欢迎的服
88、务器操作系统的第2位”。10月30日,第一个Linux live发行版Knoppix发布。2001年1月,Linux 2.4发布,进一步提升了SMP系统的扩展性,同时集成了很多用于支持桌面系统的2023 中国开源发展蓝皮书26特性:USB、PC卡(PCMCIA)的支持,内置的即插即用等功能。2003年3月6日,SCO Group公司宣布正在发起对IBM高达10亿美元的诉讼,声称IBM把SCO的商业机密整合到了Linux中。12月,Linux 2.6版内核发布。2007年8月8日,Linux基金会由开源发展实验室(OSDL)和自由标准组织(FSG)联合成立,得到了主要的Linux和开源公司,包括
89、富士通、HP、IBM、Intel、NEC、Oracle、Qualcomm、三星以及开发者的支持。11月5日,Google发布Android,被称为“第一个真正开放的综合移动设备平台”。2011年5月11日,Google I/O大会发布基于Linux内核的云操作系统Chrome OS的Chromebook。6月21日,Linus Torvalds发布Linux3.0版本。Linux内核大版本的更新周期一般是2-3个月,当前最新版本为Linux 6.4-rc4,发布时间为2023年5月28日;稳定版本Linux 6.3.4,发布时间为2023年5月24日。其Maintainer为Greg Kroa
90、h-Hartman&Sasha Levin。1.2.4 开源基金会崛起开源基金会是开源生态中的重要部分。对于非营利性且处于中立位置的开源基金会来说,他们拥有开源项目的知识产权,而且没有任何商业利益,这为贡献者、开发者、用户提供了良好的协作平台;基金会也会通过技术服务和项目孵化来帮助开发者和开源企业,如软件仓库、问题跟踪、技术指导、法律支持、项目投资、公共关系维护等;基金会还会提供项目日常的运营和治理,以满足在项目生命周期不同阶段对于管理项目的需求。自20世纪80年代自由软件基金会(FSF)开始,全球各类开源基金会快速发展,在构建全球开源生态中发挥着巨大的促进作用,据不完全统计,各类开源基金会已
91、经超过100家,其中具有代表性的包括(以下数据截至2023年4月):自由软件基金会(1985年成立)Open Source Intiative(1998年成立)Apache软件基金会(1999年成立)GNOME基金会(2000年成立)Blender基金会(2002年成立)Mozilla基金会(2003年成立)2023 中国开源发展蓝皮书27Eclipse基金会(2004年成立)Open Invention Network(2005年成立)Linux基金会(2007年成立)云原生计算基金会(2015年成立)RISC-V基金会(2015年成立)OpenJS基金会(2019年成立)TARS基金会(2
92、020年成立)SODA基金会(2020年成立)开放原子开源基金会(2020年成立)开源基础设施基金会(2020年成立)OpenSSF基金会(2020年成立)Rust基金会(2021年成立)天工开物开源基金会(2023年成立)1.3 中国开源发展简史1991年,中国与AT&T Bell Laboratories USL/USG合作,引进UNIX SVR 4.2版本源代码(全球唯一,但属于“后UNIX”闭源时期),并发布了中文版本,合作组建了中国UNIX公司;中方同时也引进“前UNIX”开放的源代码。1999年,中科红旗、中软网络、冲浪平台在引进Red Hat公司Linux发行版的基础上,分别推出
93、最早的Linux中文版本。因此,中国开源的发展历史具有两个里程碑节点:1991年、1999年,至今32年、24年,可以分为启蒙、萌芽、发展、加速四个时代。1.3.1 启蒙时代1991年,陆首群、张克治和杨天行牵头代表中方代表团与美国AT&T USG合作,美方将最新开发的UNIX版本UNIX SVR4.2源代码向中方开放。中方为此组织了UNIX新版本编辑委员会,由杨芙清、胡道元、仲萃豪、刘锦德、尤晋元、贾耀良、孙玉芳等国内资深软件专家组成,并邀集全国软件专家、程序员200多人,翻译、编辑、出版了UNIX SVR4.2中文版本共19册,首发式在人民大会堂举2023 中国开源发展蓝皮书28行,向全国
94、各大图书馆、高等院校赠书,业界影响甚大。这一历史事件被Linux基金会收录,后被作为中国开源诞生的标志性事件。1991年成为中国开源元年。1992年12月,中方与USG合资在华成立了中国UNIX公司。1994年,已经在芬兰工作5年的宫敏博士第一次将Linux和大量自由/开源软件源码通过磁带带回中国。1997年,宫敏第二次带回80GB的自由软件,并在国家信息中心的帮助下在中国经济信息网(https:/ Linux收获了第一个市场用户北京市政府政策研究室。1999年3月正式对外发布Xteam Linux中文版1.0。2001年冲浪平台在香港创业板上市。1.3.2 萌芽时代在历时8年的启蒙阶段中,自
95、由/开源软件的理念和文化开始在中国大地生根发芽,随着UNIX、Linux在中国用户的激增,以及互联网时代的到来,中国自发地涌现出一批开源社区和开源企业。在中国开源发展的萌芽阶段,Linux技术的快速普及起到了核心的推动作用。1999年9月,蓝点软件技术(深圳)有限公司成立,次年3月在美国纳斯达克上市。一个中国初创公司从成立到在美上市仅用不足200天,且上市当天股价暴涨400余倍,这个神话旷古绝今。1999年底,时任中国科学院软件所副所长的孙玉芳老师牵头筹建北京中科红旗软件有限公司和北京红旗中文贰仟有限公司,分别基于Linux和OpenOffice进行中文版红旗Linux和RedOffice的研
96、制。孙玉芳老师英年早逝,一生发表操作系统相关论文180余篇,编著和译著操作系统原理相关著作140余册,他指导过的诸多硕士/博士生现已成为开源产业的中坚力量。2023 中国开源发展蓝皮书291999年,中国软件开发者社区CSDN在蒋涛的努力下成立了,并于2000年创办程序员杂志。2000年2月,在科技部国家高技术研究发展计划(863计划)的支持下,由一批国内高校、研究院所、IT企业联合发起成立了共创软件联盟。共创软件联盟在开源许可证规则下对863计划的软件成果进行开源培育和孵化,并提出以开放源代码的协同创新模式作为中国基础软件发展的主要路径,对我国开源产业发展起到了重要的推动作用。2002年,黄
97、建忠以CJacker的ID在中国Linux公社发布了基于RedHat 8再发布的Magic Linux版本这是国内第一个Linux社区发行版。在这个阶段,部分中国开发者开始尝试向国际上游社区贡献代码。但同时,国内Linux企业对开源技术采用拿来主义,忽视开源社区、商业模式和开源知识产权等方面的投入和积累,导致在国际社区中出现了许多针对中国Linux发行商只是开源使用者的评价,直到2008年,这种印象才得以扭转。2003年,原信息产业部通过电子发展基金支持“Linux公共开发平台”的建设,并成立国家软件与集成电路公共服务平台,组织国内操作系统厂商进行Linux参考平台的研发和Linux操作系统的
98、应用推广。2004年,中国开源软件推进联盟成立,陆首群教授被推举为联盟主席。在陆首群主席的大力推进下,COPU 为推动中国开源软件的发展而不懈努力,也为促进中、日、韩乃至全球关于开源运动的沟通、交流、共享、协同与合作而努力,为促进中国、东北亚和全球开源运动作出贡献而努力。联盟的国际智囊团聘请了几十位全球顶级开源专家以多种形式参与和推进中国开源建设,如此规模的智囊团在全球首屈一指,是开源界公认的顶级智库,是COPU创建的开源高地、科技高地、创新高地、人才高地。可以说,联盟的成立和陆主席的领导加速了中国开源软件发展的速度,为碎片化的国内开源产业建立了统一的根据地,为国际开源生态和中国开源生态建立了
99、纽带。2008年,以Kernel、Apache、GNOME、OpenOffice为代表的国际知名开源社区纷纷选择在北京召开全球技术峰会,作为他们进入亚洲的第一步(之前从未在亚洲国家召开顶级技术峰会)。这是对中国开发者在社区提交贡献的肯定。因此,我们认为2008年成了中国开源发展重要的分水岭。1.3.3 发展时代在2009年前,中国常被视为国际开源资源单纯的使用者,2009年之后,中国开发者提交的代码被Linux基金会接受,排名稳居世界前四(Kernel 2.6.27之后),中国开始成为国际开源资源的贡献者。在2009年之后,伴随着云计算、物联网、大数据、移动互联网的快速发展,中国一批有实力有抱
100、负的2023 中国开源发展蓝皮书30知名科技IT企业、互联网公司开始选择拥抱开源。Linux基金会执行董事Jim Zemlin曾表示:“这些中国科技公司无论从开源技术上,还是产业、经济发展上,已经走进世界领导者行列。”在2009-2018年这十年中,中国开源呈现了百花齐放的繁荣局面,从开源开发者数量的激增,到开源社区的多样化(不再局限Linux等操作系统领域),再到知名科技企业自内而外的拥抱开源(内部实行开源治理,逐渐对外捐献开源项目,并向上游技术社区提交贡献)。2012年成立的中国开源云联盟(COSCL)和2016年成立的云计算开源产业联盟(OSCAR)就是典型的开源与云计算技术融合的产业联
101、盟。这一阶段明显的特点在于不论是初创企业还是千百亿体量的科技巨头纷纷用开源技术来构建公司自身的技术堆栈,在技术上全面拥抱开源,并越来越重视对上游开源社区和开源基金会的投入与贡献。1.3.4 加速时代2019年至今,中国开源进入了一个新的时代加速阶段。根据Linux基金会有关Kernel.org社区贡献的统计,来自中国开发者的贡献已居全世界之首(Kernel 4.14至今)。中国开源发展进入深水区,开源生态的完整性、开源社区的成熟性、开源商业模式的多样性和复合性都在发生巨大变化。由木兰开源社区牵头、多家单位联合参与起草的“中国第一个开源协议木兰许可证”已经正式发布,前不久还被OSGJ翻译为日文版
102、使用。由华为、百度、腾讯、360、浪潮等发起成立的开放原子开源基金会填补了中国没有开源基金会的空白,尽管它还不能与Linux基金会、Apache软件基金会相提并论,但在开源领域备受瞩目。在现阶段,部分领先的中国企业不满足于拥抱开源,他们正在很多创新领域跃跃欲试,希望通过开模式来对创新技术进行引领,如商汤的OpenMMLab计算机视觉开放算法、矩阵元的Rosetta隐私AI开源框架、阿里的RocketMQ海量信息中间件、京东的JD Chain开源区块链、百度的PaddlePaddle深度学习平台和Apollo自动驾驶平台、海尔卡奥斯COSMOPlat工业互联网平台的工业APP开发框架开源项目等。
103、同时,在现阶段出现了一些原生的开源明星项目,如Apache SkyWalking、Apache Echarts、Apache IoTDB、TiDB,其中一些优秀的开源项目如TiDB备受资本市场的推崇,创造了全球数据库融资历史新的里程碑。2023 中国开源发展蓝皮书311.4 开源软件与知识产权至此,我们对开源的定义和发展史有了基本的认识,在继续深入了解之前,有必要关注开源软件与知识产权的知识。1.4.1 软件知识产权的主要内涵软件知识产权是计算机软件人员对自己的研发成果依法享有的权利。目前国际上对软件知识产权的保护法律还不是很健全,大多数国家都是通过著作权法来保护软件知识产权的,与硬件相关密切
104、的软件设计原理还可以申请专利保护。软件知识产权主要包括著作权、专利权与商标权。著作权指软件的表达(如程序代码、文档等)方面的权利。专利权包括软件的技术设计,如程序设计方案、处理问题的方法、各项有关技术信息等方面的权利。商标权则是指软件的名称标识方面的权利。软件需要有硬件平台的支撑才可以运行,而在硬件平台上运行的软件基本上是目标码(二进制格式),从而造成软件源码和二进制目标码的分离和割裂,而软件作为通用商品进行销售或分发时主要提供的只是二进制文件,这也成为主流的软件销售和分发方式,并主要通过随软件一起发布的最终用户许可协议(End User License Agreement,EULA)对软件的
105、使用、修改和分享及其他相关事宜作出规定。针对上述对软件源代码的处置方式,出现了一种开放、协同、共享的软件发展模式通过开源软件许可证对软件源代码的复制、修改、再分发等权益,对商标、专利、著作权等内容进行进一步规范,这也是对软件知识产权发展的一个重要补充。1.4.2 开源软件许可证开源许可证就是开源软件使用的许可证。对开源软件许可证的法律界定先前存在一定的争议。在美国,一些法院认为软件许可证是合同(Contract),一些法院则认为是许可(License)。两者的区别在于,许可在传统上是由地产或物主作出的,目的在于允许他人使用自己的地块或物品。因此,它是单方向的,不构成完整的合同,而是作为合同的一
106、个要素,用来和他人交换的条件。2023 中国开源发展蓝皮书32合同和许可之分在美国法上具有重要意义。如果是合同,那么需要适用各州不同的合同法;如果是许可,那么需要适用统一的联邦版权法。此外,合同的违约救济和版权的侵权救济也有诸多不同,比如禁令(行为保全)的适用、判赔额的确定、律师费的分担等。不过,包括中国在内的大陆法系国家,则普遍认为开源软件许可证构成合同;只不过这种许可合同并非协商得到,而是事先规定好的标准化格式合同。具体来讲,开源许可证是涉及版权、专利、商标等一系列权利义务的格式合同,且自动生效。法律并没有限定许可证不能包含什么条款,这导致许可证的类型极其繁多、内容也非常自由。据不完全统计
107、,广义上的开源许可证目前有超过200种,即便是OSI批准的许可证目前也多达96种,其中包括由中国主导编制的Mulan Permissive Software License v2(MulanPSL-2.0),全部许可证可参见https:/opensource.org/licenses/alphabetical和https:/opensource.org/licenses/category。1.4.3 国外主流开源许可证解读(一)GNU通用公共许可证(GPL)GPL通用公共许可证是一个许可证家族的泛称,是一个被广泛使用的自由软件许可协议条款,为使用者提供了足够的复制、分发、修改的权利:可自由复制
108、;可自由分发,提供他人下载;可用来盈利,分发软件过程中收费(必须在收费前向客户提供该软件的GNU GPL许可协议);可自由地修改(使用了这段代码的项目也必须使用GPL协议)。GPL当前主要有GPL v2和GPL v3两个版本。这组许可证的共同特征在于其“传染性”:任何基于GPL代码编写的软件都必须成为开源软件。换言之,使用了任何GPL代码的软件,无论GPL代码占比多少,都必须将完整的源代码公开,并允许他人修改、发布。GPLv2许可证存在一些漏洞,例如它不能阻止一个软硬件结合的系统中,通过对硬件部分施加限制,间接阻止用户在该硬件上运行软件的修改版本;没有包括关于专利的约定,导致实践中出现Micr
109、osoft-Novell专利协议这类试图将专利申请用作于对付自由软件社群的武器的现象。2023 中国开源发展蓝皮书33为解决这些问题,GPL v3于2007年发布。除填补上述漏洞,GPL v3兼容性更好。自由软件基金会明确表示GPL v3与Apache 2.0许可证兼容。目前,使用GPL许可证的重要项目包括Linux内核和MySQL等,但新兴项目一般会选用更宽松的许可证。(二)LGPL(Lesser General Public License)LGPL叫做GNU宽通用公共协议,对产品所保留的权利比GPL少,适用于非开源产品的开源类库或框架,并可以不继承LGPL协议,使用其他的开源协议。LGP
110、L的特点在于,链接到该软件库的软件可以不适用LGPL或GPL,换言之,可以不公开源代码。LGPL的这一特性消除了在GPL下软件商用的最大障碍。尽管如此,基于该库修改而得到的软件仍然需要遵循GPL许可证。(三)Mozilla Public License(MPL)MPL允许在其授权下的源代码与其他授权的文件进行混合,包括私有许可证。在MPL授权下的代码文件必须保持MPL授权,并且保持开源,即允许在派生项目中存在私有模块,同时保证核心文件的开源。使用MPL授权的软件并不受专利的限制,其可以自由使用、修改,并可自由的重新发布。带有专利代码的版本仍然可以使用、转让,甚至出售。(四)BSD许可证系列BS
111、D许可证是由UC Berkeley首倡和维护的,版本繁多,目前常用版本包括原始的BSD-4、BSD-3以及简化的BSD-2。BSD属于宽松许可证,与MIT许可证接近但更加宽松,甚至跟公有领域更为接近。在最简化的BSD-2许可证下,保留著作权声明、许可证内容以及免责声明即可;只要满足许可证设定的条件,就可以自由地修改并发布代码。BSD-3许可证在BSD-2许可证的基础上增加了禁止背书条款(未经事先书面许可不得使用原作者之名来推广衍生作品);BSD许可证进一步增加了广告条款(衍生作品的广告材料必须说明该软件包含由UC Berkeley及其贡献者开发的软件)。(五)MIT许可证MIT许可证之名源自首
112、倡者MIT麻省理工学院,又称“X许可协议”(X License)或“X11许可协议”2023 中国开源发展蓝皮书34(X11 License)。据统计,2015年GitHub上高达45%的项目使用MIT许可证。近几年MIT许可证的份额有所下滑,在2020年市场份额第一的位置被Apache 2.0取代,但仍是最受开发者欢迎的许可证之一。MIT的特点在于条款非常简单,是开源协议中最宽松的一个:“被许可人有权利使用、复制、修改、合并、出版发行、散布、再许可和/或贩售软件及软件的副本,及授予被供应人同等权利”,加上要求被许可人保持同样的声明。(六)Apache许可证Apache许可证是一种“宽松”(P
113、ermissive)的许可证,目前常用版本是2.0,2020年成为使用最多的许可证。“宽松”是指不保证被使用软件的派生版会继续保持自由软件的形式,即:“怎么用都行,用在哪都行”。具体而言,Apache 2.0许可要求保留版权和许可声明,但允许许可作品、修改和更大的作品在不同的条款和没有源代码的情况下分发,只是未修改的部分仍然需要保留Apache许可证。除了为用户提供版权许可之外,还有专利许可,对于那些涉及专利内容的开发者而言,该协议最适合。由于上述利好条件,Apache 2.0成为了相当多流行的开源项目的许可证,最著名的例子之一就是Kubernetes。不同开源许可证就许可、条件和限制的比较参
114、见https:/ 商标使用保证Apache许可证 v2.0是是是是是是是否否否BSD-3 Clause Clear License是是是否是是是否BSD-2 Clause Simplified License是是是是是否否DPL v2.0是是是是是是是是否否GPL v3.0是是是是是是是是是否否LGPL v2.1是是是是是是是?是否否LGPL v3.0是是是是是是是是?是否否2023 中国开源发展蓝皮书35可以看出,除了允许商业性使用、分发和修改外等常见特征外,开源许可证还有两个共同点。一是开发者不承担保证责任(瑕疵担保责任)。开源代码通常都是免费提供的,因此开发者不应为他人使用该软件造成的损
115、失而承担责任。二是要求保留著作权标记。开源软件并不意味着放弃著作权。相反,开源许可证的强制效力来源,恰恰来自于作者对开源软件的著作权。因此,许可证一般都要求以适当的形式保留著作权标记(包括许可证正文以及作者署名)。1.4.4 木兰开源许可证族解读木兰许可证族由中国电子标准化研究院牵头研制,已发布版本包含木兰宽松许可证(MulanPSL v1;MulanPSL v2)、木兰公共许可证(MulanPubL v1;MulanPubL v2)、木兰白玉兰开放数据许可协议(MBODL v1)、木兰开放作品许可协议(MulanOWLs v1)。1.4.4.1 木兰宽松许可证(MulanPSL)MulanP
116、SL v2于2020年通过OSI认证,是全球首个由我国主导的国际通用中英文双语许可证,与Apache 2.0许可证有良好的兼容性,最大限度鼓励专利和版权开放,并于2021年发布日文版。截止2020年底,已有超过1万余项国内自主开源项目支持MulanPSL 2.0,得到Linux基金会、Apache基金会、华为、阿里、开源中国、CSDN等开源组织、公司和代码托管平台的支持应用,1万7千余代码AGPL v3.0是是是是是是是是是是否否MIT许可证是是是是否否Mozilla Public License v2.0是是是是是是是是?否否否Eclipse Public License v2.0是是是是是
117、是是是否否木兰宽松软件许可证 v2.0是是是是是是否否否开放数据共享开放数据库许可证是是是否是是是是否否否Microsoft Public License是是是是是是否否SIL 开放字体许可证 v11是是是是是是否否知识共享署名 4.0 国际(CC-4)是是是否是是是否否否常见开源许可证的对比汇总2023 中国开源发展蓝皮书36仓应用(Gitee 11000+,GitHub 7000+)。其中典型应用有OpenEuler、OpenGauss、方舟编译器、XiOUS等。1.4.4.2 木兰公共许可证(MulanPubL)木兰公共许可证在宽松版基础上增加了其传染性,对开源软件的分发增加了限制性要求
118、。木兰公共许可证和木兰宽松许可证间存在较大差异,均以第 2 版为例,其差别集中在“分发限制”上。木兰公共许可证类似GPL具有传染性,要求接受者必须开放源代码。而木兰宽松许可证的“分发限制”中仅仅要求保留代码中的许可证声明,并未要求再次分发时的许可证设置,不具有“传染”特质。木兰宽松许可证与木兰公共许可证的共同特点是:采用中英文表述,且具有同等法律效力;遵从表述简洁原则,容易理解;明确授予版权和专利权,不授予商标权。而区别在于前者能与现有的其他许可证友好MulanPSL V2BSD 3-clause LicenseApache License V2.0声明义务 分发时附带许可证,保留免责等声明
119、分发时附带许可证,保留免责等声明 其他使用时附带许可证,保留免责等声明许可证,保留免责等声明 分发时附带许可证 分发修改版时应明显声明已修改的文件 分发修改版源代码时保留各种声明 如许可软件含有Notice文件,则分发修改版时应带其中的归属声明专利许可 原始许可人及其关联实体提供专利许可 后续贡献者及其关联实体提供专利许可无明确专利许可 原始许可人提供专利许可 后续贡献者及其关联实体提供专利许可对 用 户专利维 权的限制 用户及其关联实体如直接对许可软件发起专利诉讼,专利许可终止 发起非诉讼维权(如行政维权),专利许可终止 通过间接方式实施上述行为,专利许可终止无 原始许可人提供版权许可 后续
120、贡献者及其关联实体提供版权许可版权许可 原始版权人及其关联公司提供版权许可 后续贡献者及其关联实体提供版权许可所有贡献者授予版权许可 原始许可人提供版权许可 后续贡献者及其关联实体提供版权许可商标许可无无无语言 采用中英双语表述,中英文版权具有相同法律效力 如果中英文版本存在任何冲突不一致,以中文版为准采用英文表述采用英文表述木兰宽松许可证与国外主流许可证的异同2023 中国开源发展蓝皮书37兼容,后者对开源软件的分发条件有限制性要求,对云计算和SaaS等新兴技术的分发也有条件限制。1.4.4.3 木兰白玉兰开放数据许可协议木兰白玉兰开放数据许可协议于2021年7月在世界人工智能大会发布第一版
121、,旨在基于中国国情和法律,针对人工智能场景下的数据使用与非商业约束做了分层详实约定,从而最大限度鼓励和助力关键数据资源的开放流通。数据要素的流通是一个复杂问题,其牵涉到技术、商业模式、法律环境等多个维度的问题,而“木兰白玉兰协议”的目的是希望从法律层面提供一套可以约定数据发布方和使用方的标准权责的文本,从而形成一种“社区行为规范”去加速数据的开放共享。考虑到数据要素流通的合规复杂性,MBODL v1基于以下原则和适用性拟定:针对人工智能训练数据集的发布拟定适用的协议。所发布数据应满足基本的公开发布、免费发布的前提。所发布数据符合国家数据安全的要求,不涉及国家秘密、国家安全、社会公共利益、商业秘
122、密等。所发布数据当前不涉及个人信息。基于当前人工智能训练数据集从权属角度可分为两类情况:第一类,数据由数据发布者合法合规所有或具备用益权;第二类,数据由数据发布者通过合法合规的方式自第三方处获取汇编组合而得。因此,MBODL对上述两类情况产出了两组不同起草策略的协议:(1)MBODL自主拥有数据或拥有处置权。在协议架构上,设置了类似CC协议的一个套组协议:GPLMulanPubl-2.0分发限制 分发时附带许可证,保留免责等声明 分发修改版时应明显声明已修改的文件,并附有日期;如果修改后的程序在运行时和用户以命令的形式交互,须在程序运行开始时显示版权等声明 分发时提供完整且便于编译的源代码 如
123、果不能遵守本许可证的条件,就要放弃分发 分发时附带许可证,保留免责等声明 对于接收到的“贡献”,必须沿用许可证做二次分发。对于“衍生作品”,需要沿用该许可证,并在明显位置提供“衍生作品”对应的源代码下载地址,约束有效期均为3年 在作品明显位置上,随“衍生作品”向接收者提供一个书面要约,表明您愿意提供根据“本许可证”“分发”的您“衍生作品”的“对应源代码”。确保接收者根据书面要约可获取“对应源代码”的时间从您接到该请求之日起不得超过三个月,且有效期自该“衍生作品”“分发”之日起不少于三年木兰公共许可证与国外主流许可证对分发的限制2023 中国开源发展蓝皮书38MBODL-SA:相同方式授权,使M
124、BODL具备传染性。MBODL-NC:非商业,可匹配不同非商业限定。MBODL-CU:仅计算使用,限定模型和分析类使用。以上协议均以MBODL基础,在“许可限制”小节中予以增加不同的限制而形成,同时也类似CC协议,可以再进行许可限制的叠加交叉,形成新的协议。(2)汇编第三方内容形成数据集。类似Open Database License(ODbL),采用“数据集结构和数据集内容分离”策略。对数据库或者数据集的结构(即数据选取、组织的方式,database scheme)和数据内容予以了拆分授权的方式。目前,MBODL(结构内容分离版)协议作为一个单独的实验性协议供各界讨论适用性和条款的实践落地可
125、能。MBODL协议突破了以往数据协议中对“使用”一词的模糊定义,将传统的“使用”一词,依照数据分析和机器学习的术语,做技术性分解和定义,便于行业内技术人员理解协议的制约。同时破局“非商业”的模糊性,对数据本身商业化、模型商业化、基于分析和模型的结论商业化做明确的独立切割。并且明确限制的类型和范畴。1.4.4.4 木兰开放作品许可协议木兰开放作品许可协议于2022年木兰峰会正式发布。本协议适用于著作权法下的作品。旨在适应开放作品的新特点,满足开放作品创作者的新需要,推动开放作品的发展。(1)当前开放作品新特点:群体化创作作品变得越来越流行,这类作品通常由多个作者共同参与完成,作品更新较快,版本较
126、多;开放作品创作者对作品的授权也呈现更加开放的新需求,如授予作品相关的专利许可。(2)木兰开放作品许可协议解决问题:授予专利许可的许可协议类别。满足了作品权利人授予作品涉及的技术方案、外观设计等专利权的需要;对多版本作品如群智作品提供了署名规范。方便了相关作品在实践过程中的使用和检索;2023 中国开源发展蓝皮书39以中英文双语表述,中英文版本具有同等法律效力,在中英文版本存在不一致的情况下以中文版为准,对中文用户理解和使用协议具有一定优势;在明确合同双方行为约束的前提下尽可能地精简条款、优化表述,降低产生法律纠纷的风险。1.5 开源与标准中国电子技术标准化研究院自2019年起开展开源标准化研
127、究,依托全国信标委和中电标协开展国内开源标准研制工作,并作为我国信息技术国际标准化工作的国内对口单位,在ISO/IEC JTC1下与其他各国共同探讨推进开源国际标准化工作。基于前期工作基础,2022年,电子标准院联合华为、华东师范、第四范式、蚂蚁、腾讯各单位的开源标准化专家,共同发布开源与标准协同发展研究报告,该报告介绍了开源生态的发展要素,给出了新趋势下开源内涵与外延,分析了开源与标准协同2023 中国开源发展蓝皮书40发展的案例和价值,提出开源与标准协同发展的工作建议。本节内容来源于开源与标准协同发展研究报告。1.5.1 开源与标准的关系开源与标准之间既是研究对象关系、规范与实现的关系又是
128、协同发展关系。开源与标准化协同发展是信息技术领域发展的最佳模式,共同构建开放的产业生态。1.5.1.1 开源与标准的关系开源与标准关系分三种:一是研究对象关系,开源作为标准化对象开展标准化工作;二是规范与实现关系,标准是技术的抽象规范,开源是标准的具体实现;三是协同发展关系,开源与标准以协同发展、相互促进的方式,共同支撑产业创新、助力产业发展。研究对象的关系开源作为标准化对象。标准化对象是指需要标准化的主题。通常,标准化对象包括两方面的内容:一是标准化学的研究对象,二是标准化工作的对象。规范与实现的关系标准是技术的抽象规范,开源则是以“开源方式”对于标准所定义规范的具体实现。协同发展的关系标准
129、是基于开放流程的、以实现兼容性和互操作为目标的技术规范的开发过程。开源是基于开放合作和代码共享为特征的技术实现过程。开源与标准是构建开放的信息技术生态的两种重要工具,两者相互补充,相互促进,协同发展,缺一不可。开源与标准关系图2023 中国开源发展蓝皮书41开源与标准协同,共筑开放的技术和产业生态1.5.1.2 开源与标准协同发展标准化是开源治理的重要手段,以开源为对象的治理,是专注于开源活动体系及其效能和风险管理的一系列治理规则,由治理主客体、组织结构和过程组成,以确保参与开源活动能够支撑组织的目标。Linux、OpenInfra、Apache等全球代表性开源基金会均将标准化作为开源社区建设
130、和发展的重点任务之一,主要围绕开源社区治理、技术开发以及推动实现互操作等方面。国内已着手布局构建自主开源规则体系,但当前开源生态仍面临基础共性理论统一、技术互联互通困难、社区治理能力尚待完善等问题,需要标准化手段推进开源运营治理规则体系建设。开源和标准协同发展,是推动开源和标准规则研究、技术及应用发展的重要基础性工作,可以共同构筑开放有序的产业生态,预防独家垄断与技术锁定;为客户提供更多选择;促进产业包容式发展;持续推动开放式创新。1.5.1.3 开源标准化价值开源规则和社区治理标准化的价值在规则层面,标准化对开源的价值体现于统一产业界认识,如开源术语、元数据、许可证等。针对开源技术和应用的相
131、关概念,是认识、理解开源技术的基础,为开源领域其他标准研制提供支撑,旨在形成行业基础共识。由我国官方推出的首个开源协议木兰宽松许可证”(MulanPSL)在此方面迈出了坚实的一步,但还需要后续更多的系列行动;在社区层面,标准化对开源的价值体现于保障社区的健康与稳定。社区文化、领导及治理能力是维护2023 中国开源发展蓝皮书42社区可持续发展的基础。社区治理遵循开放、透明、平等、共识、协作的原则,以法律法规、社区机制、治理流程、运营流程、基础设施、社区评估六大域建立开源社区治理、运营和技术框架,支撑社区可持续发展。通过建立开源社区治理机构,协调内外资源,对开源软件的许可模式和开源的知识产权保护提
132、供法律和法理的保障;通过制定开源项目的治理流程和合规规范来保障项目健康发展。开源项目和技术标准化的价值在项目和技术层面,标准化对开源的价值体现在以下几个方面:(1)开源通过实施标准并在标准的支持下实现与现有技术生态的互操作,促进开源的快速、广泛应用。(2)标准化可以支持开源技术形成稳定演进的技术框架和外部接口,与外部系统的互联互通,防止社区分裂,推动生态发展。(3)标准可以支撑开源所定义的技术成为稳定的规范,同时支持闭源实现,共同构建产业生态,保证开源项目的可持续发展。(4)标准化可以开源项目构建稳定的技术品牌的建设。例如Open Infrastructure Foundation通过DefC
133、ore标准的制定,并结合基于标准的合格评定,定义OpenStack技术品牌。通过为开源建立标准,可以解决四个方面的问题:(1)统一概念和认识当前OSD的本质是定义了开源软件的授权协议的主要特征,并非定义开源本身。同时关于开源软件、开源硬件、开源社区、开源产品、开源基金会等概念,也一直没有明确、无歧义、相互之间协调一致的定义。开源标准化价值2023 中国开源发展蓝皮书43而概念与概念之间的关系,也需要清晰的定义,如:开源基金会、开源社区与开源产品、开源项目与软件版本、开源代码仓库与开源制品等,都应建立某种符合逻辑、能够涵盖各种情况的关联关系。我国亟需一套完整的定义,将各种相关的概念统一在一个框架
134、之下。开源作为标准化对象,对于其基础共性理论及方法论,可以从国家标准层面进行统一。(2)构建互联互通的技术生态体系开源必须通过实现标准才能完成与外部系统兼容和互联互通,实现多平台的可移植性和进入技术生态系统的目标。开源与标准化协同发展过程中,将做到以团体标准为抓手,构建协调一致的技术生态体系并连接尚未联通的断点,减少行业内上下游的重复工作,同时用标准化的方式持续推进制定互联互通的标准。(3)构建技术品牌,防止社区分裂针对开源项目核心技术接口,通过标准化机制制定和发布团体标准,并基于标准建设合格评定机制,构建技术品牌。稳定的技术品牌发展路径和版本更新机制,可以增强技术社区的向心力,有助于维护开源
135、项目统一演进,防止技术社区分裂(4)建立评估体系在开源标准制定过程中,将关注如何计算、评估以及测量各种指标,如一个GitHub仓库中可以看到的stars数量、其数量背后的价值、开源项目的热门程度、技术难度、质量高低、社区健康度等指标。同时基于开源标准构建评估体系,更好服务开源生态建设。当前开源发展过程中,以标准体系化方式汇集最佳实践,并不断修订以帮助开源社区健康成长,是开源标准化工作重点关注的方向之一。1.5.1.4 标准开源化价值标准是“通过标准化活动,按照规定的程序经协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件”。标准对于开源的价值在于提供可移植性和互操
136、作性,从而提高开源软件的开发和部署效率,节省成本;同时标准制定、优化和推广也与开源项目的研发、升级和应用密切相关。(1)开源是标准制定需求的来源标准制定的需求来源于多个途径,开源作为广泛应用的软件是重要的需求来源之一。开源可以把在研发和推广过程中的客户需求和技术需求反馈到标准化流程中,通过开放的讨论形成共识,形成标2023 中国开源发展蓝皮书44准化文本,并通过标准化体系广泛推广,支持更多形式的标准实现,包括其他的开源项目、闭源软件,共同构造产业生态。(2)开源是标准优化的基础标准通过版本演进实现不断优化。开源在广泛应用过程中积累发现的问题不仅通过代码实现即时改进,对于影响兼容性和互操作的技术
137、模块也应当及时反馈到标准化,实现标准的持续优化,提高标准的质量,并通过标准化体系为开源生态的扩展提供更大的支撑。(3)开源帮助验证标准的可行性标准作为抽象的技术要求需要得到验证,开源可以提供代码实现验证标准的可实现性,并将实现过程中遇到的问题回馈标准化流程,有利于提高标准的质量。(4)开源帮助推广标准标准通过开源代码的实现加速了标准的快速应用。一般的标准都立足于技术的高层定义,以满足多种实现方式的需求,而无法直接通过代码方式使用。开源作为代码的直接实现,可以快速实现标准,大幅度提高了标准的易用性,可以推动标准的广泛使用。当然标准不仅支持开源实现,也支持闭源实现。例如,TCP/IP协议栈的实现,
138、有开源的版本,也有闭源的版本,特点不同,面对不同用户的需求,满足在使用标准过程中对于多样性的需求。1.5.2 开源与标准协同发展现状开源与标准之间既是研究对象关系、规范与实现的关系又是协同发展关系。开源与标准化协同发展是信息技术领域发展的最佳模式,共同构建开放的产业生态。以国家标准结合团体标准的方式来共标准开源化价值2023 中国开源发展蓝皮书45同促进开源生态可持续健康发展。1.5.2.1 开源的标准化需求(1)开源规则和社区治理的标准化。开源要素包括术语、概念和规则等需要通过标准化达成共识,否则会埋下混淆的隐患。目前开源的一些重要要素由“开放源代码促进会”(Open Source Init
139、iative,OSI)定义,符合其发布的“开源定义”(Open Source Definition,OSD)已经成为业界广泛应用的、用于确定“开源许可证”的标准;在OSD的基础上OSI发布的“开源许可证”在业界应用广泛;同时,OSI还建立了许可证审查流程,“确保标记为开源的许可证和软件符合现有的社区规范和期望”。OSI标准在开源领域内达成了共识,防止开源的滥用。(2)开源项目和技术的标准化。大量开源社区建设标准化流程,围绕开源项目和技术制定团体标准,并基于团体标准推动国际标准的制定。例如,Linux Foundation建立了标准化组织Joint Development Foundation(
140、JDF),2020年经ISO/IEC JTC1批准,成为公开可用规范(PAS)提交者;Eclipse Foundation设立Eclipse Foundation Specification Process,“为制定开源社区驱动的、开源友好的规范提供开放和透明的框架”;OpenInfra Foundation为OpenStack技术品牌的定义成立了DefCore标准项目,用于“确定如何授予OpenStack的商业实施使用商标的指导原则”。1.5.2.2 标准的开源化需求标准化组织建设开源项目,围绕标准的验证、实施和推广开发开源代码。例如,万维网联盟(World Wide Web Consort
141、ium,W3C)建立开源项目W3C Open Source Software,认为“W3C标准的自然补充是可运行的代码,实现和测试是标准开发的重要组成部分,发布代码促进了开发人员社区的思想交流”;结构化信息标准促进组织(Organization for the Advancement of Structured Information Standards,OASIS)建立开源项目Open Projects,支持社区“在开源许可证下开发所需技术代码、API、标准、参考实现”;致力于Java语言标准开发的Java Community Process标准组织建设OpenJDK开源社区,“为JavaS
142、E JSRs标准提供开源参考实现”。2023 中国开源发展蓝皮书46全球开源开发者快速增长的地区Top10第二章 开发者发展现状开源软件在全球技术发展中已成为不可或缺的一部分,并对技术创新、合作和贡献产生了深远影响。开源为开发者提供了一个具有开放性、透明性的自由交流、分享、协作的平台。与此同时,开发者立足于项目、企业、社区、基金会,通过编写、测试和优化代码,以及运营、治理等方式,深度参与开源的创造、贡献、建设,在开源项目的成功、社区的生态繁荣、百业同鸣历程中起着至关重要的作用。2.1 中国开源开发者规模、增速及发展趋势2.1.1 开发者基本画像全球开源生态研究报告指出,得益于开源写入“十四五”
143、规划,国家层面对开源的重视程度不断加深,相较往年开源支持政策体现在新技术发展得推动方式,近年开源政策更加体系化和多样化。在此趋势下,企业重视程序持续提高,开发者队伍日渐庞大。中国开源开发者的数量呈现出快速增长的趋势。据GitHub 2022年数据统计,GitHub平台开发者数量达到9400万开发者,开发者同比增长 27%,新增用户超过2050万,全球有90%的公司在使用开源,2022年有4.13亿次开源贡献。按照国家/地区来划分,2022年中中国新增开发者数量占GitHub新增开发者数百分比为15.6%。据2023 年4月工信部透露,我国开源软件开发者数量已经突破800万,居全球第二,中国开源
144、开发者的增速令人瞩目。据 C SDN Gi t C o d e、P i n g C A P OSSInsight、北京大学软件与微电子学2023 中国开源发展蓝皮书47中国开发者占比院荆琦副教授联合出品的2022 中国开源贡献度报告统计,中国拥有占全球30%的最大规模开发者群体,开源增长空间和潜力巨大。该报告以两年作为统计期,全球贡献者(以邮箱统计)共计213,982人,贡献者地区为中国的用户数为10,691人(仅包括填写地区的中国贡献者),预计中国开发者占总贡献者的数量约为9.5%(假设未填写地区的和填写地区的中国贡献者比例分布一致)。基于国内主流的技术社区及论坛的注册用户数,观察中国开发者
145、的整体增长趋势时发现,中国开发者社区CSDN,拥有注册账号是8700万,而注册用户在排重以后是4200万,相较2021年新增了600万用户。这新增的600万用户里,新增用户中有60%都是大学生和高中生,高校计算机专业学生覆盖度90%,非常的年轻化。与此同时,CSDN已推出开源代码托管平台GitCode,为中国开源生态提供源代码托管、项目管理、DevOps、安全扫描、安全监控等免费服务;推出开源工具平台InsCode,打造面向开发者的集编程,创作,分享于一体的全新共创开源社区,为开源人才的学习和成长赋能。根据开源社区Gitee统计,2022年Gitee新增了200万的用户,平台仓库数量达到250
146、0万,新仓库数量为480万,总用户数达到1000万。2.1.2 开发者行业、地域、技术特点等根据CSDN发布的2022-2023 中国开发者调查报告显示,我们将开发者根据年龄范围划分成三类发现,30岁以下的开发者人数占71%,本科及以上学历占8成,89%的开发者都是男性。软件行业涵盖了国内近半数开发者,40岁以下的开发者从事后端开发的比例最高。40岁以上开发者主要担任技2023 中国开源发展蓝皮书48开发者基本特征术经理以及架构师的职位,所属行业重点分布在互联网、软件、教育领域。2023 中国开源发展蓝皮书49开发者地域分布(省、自治区、直辖市、特别行政区)Top 15全国超过40%的开发者工
147、作在一线城市(其中以北京、上海、广州、深圳为主)。北京、广东是开发者聚集较多的地域,占全国总数28.2%。上海、江苏地区的开发者占比数量处于第二梯队,占全国总数的15.1%。2023 中国开源发展蓝皮书50开发者是否使用过开源软件比例开发者参与开源项目的比例开源正在吞噬世界,在日常的开发工作中,无可避免地要使用到开源软件,数据显示,96%的开发者正在使用开源软件,仅有2%的开发者表示从未使用开源软件。当然,开发者在使用开源开源的过程中,也参与开源、回馈开源。相较去年42%的开发者参与过开源,今年有较大幅的增长,49%的开发者参与过开源项目,接近一半的开发者加入了开源的大队伍。2023 中国开源
148、发展蓝皮书51开发者在开源上花费的时间开发者参与开源的方式67%的开发者每周在开源上投入的时间不超过5小时,随着开源的发展,有更多的人从事开源相关的工作,数据显示,有4%的开发者每周在开源上投入30小时以上。在开源项目的贡献上,主要还是通过代码和文档的贡献,在参与过开源项目的开发者中,有72.9%的开发者有代码贡献,49%开发者有文档贡献。2023 中国开源发展蓝皮书52开源中常用的开发语言在开源项目中,Java依然是最常用的开发语言,有41%的开发者表示,在开源项目中经常会使用到。其次是Python,占比27%。2023 中国开源发展蓝皮书53开发者关注的开源技术领域中国开源开发者在各个技术
149、领域都有涉猎和贡献。从人工智能、大数据到区块链、云计算等领域,中国开发者在各个前沿技术的开源项目中都有积极参与和贡献。他们不仅关注国内的开源项目,也积极参与到国际开源社区中,与全球开发者共同推动技术的进步。人工智能的发展,吸引了众多开发者的目光,45%的开发者比较关注开源AI,其次是编程语言。2023 中国开源发展蓝皮书542.2 开源开发者对开源社区、开源活动和开源项目的投入和贡献数据显示,开放透明的代码和知识共享是吸引众多开发者使用开源软件的最大因素之一,占比55.8%。为了促进开源生态的可持续发展,越来越多的开源社区和组织在中国成立,为开发者提供了学习、交流和合作的平台。同时,一些国内知
150、名的技术企业也在积极推动开源文化,通过开源项目和活动,促进开发者之间的合作和创新。2.2.1 开源社区和开源活动根据开源社汇总的中国开源地图,2022年中国开源社区新增21个组织,增幅明显。在2021年,开源社区增速最快,一年新增42个。吸引开发者使用开源软件的因素社区创始年表2023 中国开源发展蓝皮书55就地域而言,多数社区聚集在北京地区,共有69个社区,包括Apache IoTDB、开源GitOps产业联盟、Apache ShardingSphere、Apache Doris、亚马逊云科技、OceanBase等。杭州的开源社区数量排名第二,有Apache RocketMQ、阿里云Pola
151、rDB开源社区、Ruby China、龙蜥社区、KubeEdge等19个。上海地区也有19个开源社区,覆盖KubeSphere、Neo4j开发者社区、OpenMLDB社区、X-lab开放实验室等。社区城市排行2023 中国开源发展蓝皮书56大数据在开源社区领域的类别中数量最高,有46个。一方面,在数字化时代,大数据发展起步较早,行业对大数据技术和工具的需求非常高;另一方面,大数据领域的技术非常复杂,涉及到分布式计算、数据存储和处理乃至机器学习等多个方面,这也涌现了Hadoop、Spark、Kafka等成熟的技术工具和框架。云原生和云计算开源社区数量排在第二和第三位,分别有43个和39个。中间件
152、、机器学习、数据库的社区数量在近几年增长迅速,如今均达到了31个。在过去一年,国内举办了多场开源社区活动和会议,为开发者提供了学习和交流的机会。例如:2022开放原子全球开源峰会于2022年7月27-29日在北京成功举办。本届峰会以“软件定义世界,开源共筑未来”为主题,以立足中国、面向世界的姿态,宣扬开源成果,传递“开放共享、共建共治”理念,打造成为国际开源盛会,赢得社会各界广泛好评和高度关注。由开源社举办的2022第七届中国开源年会(COSCon 2022)在2022年10月29日-30日于线上成功举办,这次会议以“Open the World!”为主题,以Open对抗Close、以Conn
153、ection对抗Broken、以Public Good对抗Bad News,希望能以开源的技术、开源的方式、开源的力量,治愈这个世界。2022长沙 中国1024程序员节于2022年10月23-25日在长沙、北京等多地同步举行。本次程序员节以“算力新时代,开源创未来”为活动主题,由5大院士领衔,四城联动,开设十余场专业主题论坛,覆盖AI、芯片、数据库、大数据、数字化转型、工业互联网等技术领域,囊括中国根技术掌门人、8大海外开源技术掌门人等多场尖峰对话环节,以及代码比拼、企业创新展等特色嘉年华活动。全球开源技术峰会(Global Open-source Technology Conference,
154、简称 GOTC),是面向全球开发者的一场盛大开源技术盛宴。GOTC 2023在2023年5月27日-28日上海成功举办,这次开源行业盛会以行业展览、主题发言、特别论坛、分论坛的形式展现,与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题,以及开源社区、开源商业化、开源教育培训、云原生等热社区领域排行2023 中国开源发展蓝皮书57门话题,探讨开源未来,助力开源发展。2.2.2 开源项目2022中国开源贡献度报告根据每个项目中提交是否为中国开发者的提交,按照大于标注为中国地区开发者的提交占比超过40%为主要标准,外加CSDN、Gitee等国内社区标签信息为参考,确
155、认674个项目为中国开发者主导的项目,占比约12.5%。中国项目占比2023 中国开源发展蓝皮书58一个值得关注的数据是:在674个中国项目两年内收到的343,735个提交中,标注地区信息的开发者提交数为205,528。其中,中国开发者的提交136,350,占比66.3%。国际开发者提交69,178,占比33.7%。国际开发者高于三成的参与率,说明中国的开源项目正在走向全球,引起了全球开发者的关注。这意味着中国开源势力已经开始登上国际化的舞台。报告根据GitHub Event的数据,汇总出“中国开源项目 Top20”(注:由于本轮发布项目排行数据主要参考GitHub中Event数据,目前在Gi
156、tHub中没有数据的项目尚未计算在内,例如OpenHarmony、openEuler、MindSpore等)。榜单上,位列前五的是ant-design、vue-element-admin、echarts、frp,以及 dubbo。有五个项目的Star数超过五万,Fork数最高为ant-design的36,086,贡献者近两千人。值得注意的是,Top20的项目中,阿里系占到6席(包括阿里巴巴、蚂蚁集团和饿了么),这与阿里在GitHub上的长期沉淀不无关系。早在五年前,阿里就成为唯一一家入围GitHub顶尖贡献名单的中国公司。中国项目贡献分布2023 中国开源发展蓝皮书59中国开源项目TOP 20
157、根据2022 中国开源年度报告,中国项目中,排名前两名的项目遥遥领先,后续项目OpenRank值相近,说明中国开源项目正在平稳发展。Top30榜单中,我们发现中国顶尖开源项目在前端、数据库、云原生、人工智能领域表现突出。其中ant-design/ant-design表现优异,项目参与者方面,ant-design达到了最高的3882 人,巴士系数也达到了2530人,在issue解决时间以及活跃度方面也有不错的表现。2023 中国开源发展蓝皮书60中国项目OpenRank排名Top302023 中国开源发展蓝皮书61全球贡献排名前50的公司中有10家国内企业上榜。整体来看,前五分别是谷歌、脸书、英
158、特尔、红帽,以及美国超威半导体。中国上榜公司包括华为、阿里巴巴、联发科(中国台湾)、腾讯、乐鑫科技、百度、字节跳动、中兴、瑞昱(中国台湾),以及涛思数据。其中,华为的贡献度遥遥领先,排在第六,前三十中还有阿里巴巴和联发科,其余七家在30到50位之间。全球公司开源贡献榜TOP 502023 中国开源发展蓝皮书62在国内,通信、互联网、大数据、云、电子等领域的头部公司对开源作出重要贡献。中国公司开源贡献榜TOP 202023 中国开源发展蓝皮书63在捐献到Apache Software Foundation和Linux Foundation的中国项目中,Apache项目的整体数据表现亮眼,Shar
159、dingSphere、Pulsar、Flink、tvm等项目名列前茅,值得指出的是,Flink在没有使用GitHubIssue功能的情况下影响力第三,活跃程度可见一斑。基金会中中国项目排行Top202023 中国开源发展蓝皮书642.3 开源开发者的需求和面临的挑战2.3.1 调研需求分析虽然近年来,中国的开源发展速度非常迅猛,且自2021年以来Apache基金会的孵化项目基本都来自中国,未来中国必将会是参与国际开源的一股重要的力量。不过,2022中国开源贡献度报告指出,当下从项目来看,主流开源项目国内席位稀少,国际开源Top50项目中,中国只有ant-design和vue-element-a
160、dmin两个项目上榜,排名17和26,均为前端项目。国际开源项目Top502023 中国开源发展蓝皮书65从开发者角度来看,开发者对于开源协议、内源、开源办公室等含义的理解与适用的程度还远远不足。据CSDN2022-2023中国开发者调查报告显示,在各家公司开始发力内源(InnerSource)加速公司类部代码共享初期,仅14%的开发者对其有较深入的了解。要想更好的发展内源,各公司还需要加大投入。此外,开源协议是开源的重中之重,在开发者中,了解最多的是Apache许可证,占比43.8%,其次是MIT许可证。值得注意的是,依然有21.4%的开发者在使用开源项目时,没有关注过开源协议就直接进行使用
161、,这可能使自己以及所在的企业陷入开源合规风险。开发者对内源的了解程度开发者了解的开源许可证2023 中国开源发展蓝皮书66国内外有很多公司在开源浪潮下都建立了开源办公室,主要职能是设置代码使用、分发、选择、审计相关政策、培训开发人员等。到目前为止,还有超过半数的开发者完全没有听过开源办公室。与此同时,63%的开发者表示未曾在开源中获得收入,依然在用爱发电,依然靠着自己的热爱在勉力支撑。实际上,这样的状况,已经到了迫切需要改变的时候了,否则,下一个类似colors.js作者直接“删库”最终导致数千个应用程序无限输出乱码的悲剧,依然会发生。2.3.2 建议基于以上挑战,需要开源社区和相关企业共同协
162、力解决,从而更好地推动整个行业向更加开放、透明、合作的方向发展。在此,分享一些建议和措施:1.提升国际化影响力:提供培训、指导和资源,鼓励和支持中国开源开发者积极参与和贡献到全球主流开源项目中,帮助开发者对开源办公室(OSPO)的了解程度开发者在开源上获得的收入2023 中国开源发展蓝皮书67他们融入全球开源社区。打造高质量的开源项目,能够满足国际标准和需求,推动中国开源项目在全球开源社区中的知名度和影响力,提高其在全球主流开源项目中的席位。提供良好的中英文文档、教程和示例代码,帮助新用户更好地了解和使用项目。同时,及时响应用户的反馈和问题,不断改进和优化项目。多参与国际开源标准和组织,与全球
163、开源社区保持密切联系。2.加强内源理解和实践:提供培训和教育资源,帮助企业内部员工、开发者深入理解内源的概念和实践,并在项目开发中积极采用内源模式。建立内源文化和价值观:强调开放合作、共享知识和透明沟通的价值通过奖励机制、认可制度或内源贡献者的称号,激励开发者积极参与内源实践。提供支持和反馈渠道:建立一个反馈渠道,让开发者能够提出问题、分享经验和寻求支持。3.加强开源文化的推广:加大宣传力度,提高开发者对开源办公室的认知。举办开源活动、研讨会和培训,让更多开发者了解开源文化和实践的重要性。建立开源社区的合作机制,促进开源办公室与开发者之间的联系和交流,共同推动开源的发展。4.开发者收入机制的改
164、进:探索多元化的开源项目收入模式,例如基于赞助、捐赠、咨询服务和定制开发等方式,为开源开发者提供更多的收入来源。建立合理的激励机制,鼓励开发者在开源项目中的贡献,并将其贡献价值化,以吸引更多开发者积极参与和贡献。总的来说,提升中国开源开发者的国际化影响力、加强内源理解和实践、推广开源文化以及改进开发者收入机制,这些努力将有助于解决中国开源开发者面临的挑战,并推动中国开源生态系统的发展。2023 中国开源发展蓝皮书68第三章 开源项目发展现状3.1 GitHub中国项目活跃度及趋势3.1.1 中国开源项目的总体现状通过统计全域GitHub事件日志,可以看到近5年全球开源的总体活跃情况,各项指标都
165、在明显上升,特别是疫情后有一个加速上升的趋势。同时活跃仓库数量目前保持着大约24%左右的增速,显示了全球开源发展中的增速。此节包含近五年中国项目在GitHub日志的事件总量、活跃仓库数量、活跃在中国项目上的开发者总量的变化趋势。在经历了疫情前后的快速增长后,开始处于一个稳定的增长期。中国在2022年的日志事件和活跃仓库数均有明显的增长,相信在国家各项政策性意见的出台下,中国开源的发展会越来越好。3.1.2 中美企业开源贡献对比为了更好地展现中国企业在全球范围下的开源贡献整体水平,本报告通过对比美国头部企业参与开源贡献的数据来进行分析,四张表分别为:2022年美国活跃度排名TOP 10的开源贡献
166、企业、中国活跃度排名TOP 10的开源贡献企业、美国开源影响力排名TOP 10的企业、以及中国开源影响力排名全球GitHub事件日志、活跃仓库、活跃开发者五年趋势图中国项目GitHub事件日志、活跃仓库、活跃开发者五年趋势图2023 中国开源发展蓝皮书69TOP 10的企业,可以看到:美国的传统互联网大企业活跃度与影响力排名仍然靠前。由于微软已使用GitHub作为大部分团队的日常开发平台,故项目数量较大,总活跃度第一,与第二名Google的差距逐渐拉大;著名的开源独角兽公司HashiCorp也榜上有名。中国阿里巴巴的项目数量和总活跃度均为国内企业第一,但整体项目体量以及活跃度总量距离美国Goo
167、gle等大企业还有一定差距;而中国的开源初创企业和项目则表现抢眼,按照项目平均活跃度,可以看到如PingCAP(tidb,tikv)、Baidu(PaddlePaddle)、ESPRESSIF(esp-idf)都脱颖而出。影响力指标更关注开发者生态。体量上中美存在一定差距,在项目平均影响力上则相当,中国企业映云科技(EMQ)进入榜单,该公司成立于2017年,主要的开源项目emqx有着相当不错的开发者生态。进一步,本报告也详细分析了中国企业近5年的开源发展趋势,包括活跃度趋势与影响力趋势。可以看到阿里巴巴、百度、蚂蚁三家企业长期名列前茅;阿里长期排名榜首,而百度近几年也明显加大了对开源贡献的投入
168、,初创企业PingCAP也是一直稳居第四的,需要注意的是鼎石科技在2021年上榜并在2022年达到第8位,其目前已捐献给Linux基金会的StarRocks数据库影响力不容忽视。美国企业活跃度TOP 102023 中国开源发展蓝皮书70中国企业活跃度TOP 10中国企业影响力TOP 10中国企业活跃度TOP 10 2018 2022中国企业影响力TOP 10 中国开源发展蓝皮书713.1.3 中国项目活跃度与影响力情况在开源项目洞察这部分,同样根据活跃度和影响力,分别比较了全球和中国排名前20的开源项目,可以看到:在单个项目上,中国主导的开源项目的活跃度和影响力距离
169、全球顶级开源项目的活跃度与影响力还有一定的差距,特别是在影响力方面,需要长期建设,需要最大限度融入全球开源生态里。中国主导的开源项目中,百度PaddlePaddle相关的两个项目保持上升,活跃度与影响力均位列第一。PingCAP旗下的两个开源项目(TiDB、TiKV)与StarRocks已捐献给Linux基金会的数据库则表现不俗。在近5年的变化趋势上,活跃度方面,PaddlePaddle相关的两个项目保持上升;影响力方面,ShardingSphere和MeterSphere则稳步上升。GitHub全球项目活跃度TOP 202023 中国开源发展蓝皮书72中国项目活跃度TOP 202023 中国
170、开源发展蓝皮书73中国项目影响力TOP 20全球项目影响力TOP 202023 中国开源发展蓝皮书74近五年中国活跃度TOP 10项目变化趋势图Paddle项目上升至第一,TiDB上升至第二。StarRocks在2021年上榜,2022年直接上升至第三位。近五年中国影响力TOP 10项目变化趋势图PaddleOCR在2020年开源以来,活跃度和影响力都飞速进步,很快就进入了顶级项目行列。同样,MeterSphere自2020年上榜以来影响力逐渐上升。从下图中同样可以看出2020年以来项目影响力竞争激烈,反映出中国开源项目积极的发展。中国项目活跃度TOP 10 2018-2022中国项目影响力T
171、OP 10 2018 20223.1.4 数据库领域项目分析本小节从数据库领域角度出发,分别给出了数据库领域影响力和活跃度TOP 10项目、数据库各子领域TOP 5影响力和活跃度变化趋势以及近5年TOP 10项目的影响力变化趋势。数据库领域影响力TOP 10可以看出Clickhouse活跃度和影响力稳居第一,数据库领域影响力TOP 102023 中国开源发展蓝皮书75Elasticsearch其次。ClickHouse是俄罗斯的Yandex于2016年开源的用于在线分析处理MPP架构的列式存储数据库,作为高性能的OLAP数据库,其性能十分优越,查询速度极快。数据库领域项目TOP 10影响力变化
172、趋势从下图可以看出Clickhouse双指标均在2022年上升至第一位,Elasticsearch和Spark有一定的回落,排名较后的项目双指标均有不同程度的增长。数据库各子领域TOP 5影响力变化趋势本节给出了数据库下各个主要子领域的影响力变化趋势,从趋势图可以看到,关系型数据库连年位居第一且影响力不断增长,其他类型数据库影响力均处于稳定期。数据库领域项目影响力TOP 10 2018 2022数据库子领域影响力TOP 5 2018 20223.2 基于OSS Compass的国内开源发展现状洞察开源指南针(OSS Compass,https:/oss-compass.org)面向GitHub
173、、Gite等托管平台上托管的所有开源项目开放,为国内外开源社区提供公开的SaaS服务,用于开源社区健康分析。本报告以收录于开源指南针平台的国内代表性开源项目为样本,对国内开源软件的发展状态进行评估和洞察,涉及国内开源软件项目74个,涵盖了人工智能、OS发行版、数据库、云原生、前端、中间件、嵌入式OS、安全等多个领域。3.2.1 开源指南针(OSS Compass)平台开源指南针平台由开源中国、华为等国内著名企业以及南京大学、北京大学等国内知名高校联合发2023 中国开源发展蓝皮书76开源指南针评估体系起,于2023年2月21日正式对外发布并提供服务。其创立的愿景是为包括但不限于OSPOs、社区
174、管理人员、学术研究人员、项目所有者、维护者、开发者等广大开源社区的参与者提供公开、客观、量化的评估指标体系和评估结果。通过分析大量开源项目的实际数据,并参照行业最佳实践和学术界的研究结果,以评估促发展,为开源软件社区和生态的健康发展提供助力。如上图所示,开源指南针平台目前以“产业生态健康(Business Ecosystem Health)”理论模型为指导,通过连接国际开源社区健康评估组织CHAOSS社区的指标体系,形成了针对开源软件项目和生态的三维度健康评估体系。该三维度体系包括生产力、稳健性和创新力。该指标体系可以从内部效度、外部效度和结构效度等多个方面,采用包括内容效度、因素独立性、区分
175、于预测能力等多项指标,对其有效性进行充分的评估和验证。基于该健康评估模型,开源指南针平台针对托管在GitHub和Gitee上的大量项目进行了评估和分析。目前,针对GitHub和Gitee托管平台,已经实现了针对包括人工智能深度学习框架、ChatGPT、大数据、数据库、云原生、代码分析等在内的超过200个领域、18000个开源软件仓库的评估,并在持续增长过程中。3.2.2 国内开源领域发展现状下面将基于开源指南针已经公布的协作开发指数、社区服务与支撑、活跃度和组织活跃度四个度量模型,对2022-2023年度的数据开展分析。其中每个度量模型由多个原子度量指标综合形成,具体参见开源指南针的评估模型定
176、义(https:/oss-compass.org/docs/zh/dimensions-define/)。本节选取OSS Compass收录的国内各典型领域中的代表性开源项目,对其年度发展状态进行分析。2022-2023年度具体时间为2022年5月1日-2023年4月30日,用于对比的上一年度具体时间为2021年52023 中国开源发展蓝皮书77月1日-2022年4月30日。代表性领域和开源项目整体情况如下表所示,参考OSS Compass专家意见和上一年度的开源蓝皮书相关章节,选择了人工智能、OS发行版、数据库和云原生等九个典型的应用领域中包括MindSpore、PaddlePaddle、T
177、HUDM、OpenLMLab、OpenHarmony、ShardingSphere等在内的共74个国内具有代表性的开源项目作为样本开展分析。整体情况如后图所示,在2022-2023年度,国内开源的整体平均活跃度、组织活跃度、协作开发指数、社区服务与支撑指数为0.326、0.153、0.333和0.314。相较于2021-2022年度,本年度的活跃度、组织活跃度、协作开发指数、社区服务与支撑指数分别上升了3.5%、6.3%、4.4%和3.3%。对比上一年度,2022-2023年度国内开源的整体发展呈现稳中求进,在波动中上升的态势。人工智能领域分析随着深度学习技术在近年来的持续发展,特别是Chat
178、GPT等大语言模型取得的突破性进展。人工智能领域得到了各界的广泛关注,包括华为的MindSpore、百度的PaddlePaddle、清华大学THUDM团队的项目、OpenLMLab、TVM等项目都是国内在人工智能领域的典型代表。为此,我们选择人工智能领域作为典型,开展深入分析。领域代表性项目人工智能MindSpore、PaddlePaddle、THUDM、OpenLMLab、apache/tvmLinux操作系统发行版openEuler、龙蜥、CloudOS智能终端操作系统OpenHarmony数据库OceanBase、OpenGauss、TiDB、ShardingSphere云原生apach
179、e/apisix、goharbor/harbor前端apache/echarts、ant-design/ant-design、NervJS/taro、ant-design/pro-components、ant-design/ant-design-pro、umijs/umi、web-infra-dev/modern.js、alibaba/ice、dcloud/uni-app、Tencent/Hippy、Tencent/wepy、alibaba/rax、didi/chameleon、areslabs/alita、iqiyi/LiteApp、umijs/qiankun、micro-zoe/micro
180、-app、alibaba/beidou、alibaba/lowcode-engine、baidu/amis、web-infra-dev/rspack、vitejs/vite、ctripcorp/moles-packer、element-plus/element-plus、arco-design/arco-design、ecomfe/san-mui、Tencent/weui、didi/cube-ui、zhihu/griffith、alibaba-fusion/next、jdf2e/nutui、fex-team/webuploader、wux-weapp/wux-weapp、alibaba/Biz
181、Charts、fex-team/kityminder、spritejs/spritejs、alibaba/f2etest、didi/AgileTC、alipay/SoloPi、dvajs/dva、alibaba/pont、thx/RAP、thx/rapper、didi/di18n、baidu/san、NervJS/nerv、Tencent/omi中间件apache/flink、alibaba/nacos、apache/shardingsphere、apache/dolphinscheduler、k3s-io/k3s、apache/dubbo嵌入式OSrtthread/rt-thread、djy
182、os/djysrc、alibaba/AliOS-Things安全Tongsuo-Project/Tongsuo、Mbed-TLS/mbedtls、google/boringssl本节所包含的代表性领域和开源项目细则2023 中国开源发展蓝皮书78自上而下分别是活跃度、组织活跃度、协作开发指数和社区服务与支撑指数。蓝色均值和绿色中位数分别表示人工智能领域在相关指数上的均值和中位数。黄色的总均值和总中位数,则对应了所有领域在相关指数上的均值和中位数。从后图可以看出,除社区服务与支撑指数,人工智能领域对比其它领域在活跃度、组织活跃度、协作开发指数上,其均值和中位数均稳定保持在总均值和总中位数之上,展
183、示出了人工智能领域的长期活跃。同时,可以明显看到在2023年3月左右,人工智能领域的活跃度、协作开发指数和社区服务与支撑指数呈现出了一个爆发式的增长。特别是社区服务与支撑指数,从低于总均值和总中位数的位置,短期形成了大幅超越。ChatGPT的发布是引发这一轮人工智能领域在2023年初的爆发式增长的主要因素。自2022年12月以来,OpenAI对ChatGPT进行了一系列的发布(https:/ 中国开源发展蓝皮书793.2.3 国内开源项目发展的挑战与建议加大基础软件的投入:相较前端项目,国内在基础软件,如OS发行版、中间件、数据库等领域能够发掘出的代表性开源软件项目的数量仍相对较少。基础软件作
184、为关键软件,如何培养国内相应的优秀人工智能领域的发展趋势2023 中国开源发展蓝皮书80开源社区,提升整体研发能力,是值得关注的一个话题。人工智能领域要维持发展后劲:在重点关注的人工智能领域,随着ChatGPT的提出,国内的相关框架、模型和应用发展迅速。目前国内有百度的文心一言、华为盘古、清华大学的ChatGLM、复旦大学的MOSS等模型。人工智能作为未来发展的重点方向之一,是一个充满机遇的领域。但是总体而言,国内开源的大模型框架仍然较少,中文支持仍不够强大。从指标分析结果来看,整个国内人工智能社区要维持其发展的后劲,还需要更多的投入。要提高个人贡献者的数量和比例:综合活跃度和组织活跃度的指标
185、分析可以看出,在当下备受关注的人工智能领域,每周平均活跃贡献者数量不超过500,其中近30%的活跃贡献者来自于组织,且有向头部组织聚集的趋势。如何在国内的广大程序员、相关专业学生群体中,培养开源文化,丰富贡献者的来源,壮大国内开源贡献者队伍规模,是我们要长期关注并采取切实行动的一个重要问题。3.3 中国重点领域开源项目发展现状3.3.1 开源操作系统国产开源操作系统在近年来得到飞速发展,从趋势上看,已经进入行业整体即将起飞的阶段。从传统上看,操作系统的开发属于底层基础软件,复杂性很高,开发和维护资源投入需求巨大,却很难直接转化成商业利益回报,因此一直以来大型企业对于自研操作系统的决策都是非常谨
186、慎的,而国内专业从事操作系统开发的软件企业、操作系统厂商(OSV),却都一直处境艰难。近年来随着政府一系列鼓励本土操作系统发展的政策推动,国家应对信息安全威胁的需求,再加上国内市场的旺盛需求,以及国内科技实力的提升,国产操作系统的发展进入了一个迅猛发展的前夜,腾飞指日可待。大部分的国产操作系统都是基于开源的Linux,同时也出现了像Open Harmony这样完全自主开发的操作系统。在数据中心和服务器领域,基于开源Linux操作系统进行定制化和创新是仍然是主流,但相对于早年,近年来中国操作系统行业最大的变化在于,国内系统软件社区的飞速发展和普及,社区化是相对于以前靠单个公司和组织的开发模式的显
187、著变化,也是国内操作系统行业近年来飞速发展的引擎。国内目前有四个主流的开源操作系统社区,分别是欧拉社区(openEuler),龙蜥社区(OpenAnolis),OpenCloudOS以及OpenHarmony;目前这四个社区都已经捐赠或者正在捐赠到同一个开源基金会,开放原子基金会(OpenAtom Foundation)。2023 中国开源发展蓝皮书81促使国内开源操作系统社区出现和迅速发展的直接因素之一,是国际开源操作系统CentOS的停止服务。CentOS是一个基于Red Hat商业版企业的开源的Linux发行版,由于与Red Hat商业版(RHEL)100%兼容,以及免费,开源的特性,长
188、期以来国内有大量企业和用户在使用和定制基于CentOS的Linux操作系统。2020年12月,Red Hat和CentOS项目组宣布CentOS Linux项目停止维护,到2021年底CentOS8系列已经完成生命周期支持,另外CentOS7也将于2024年6月底停止支持,由此寻求CentOS的替代成为众多企业的当务之急。龙蜥操作系统(Anolis OS)为CentOS用户提供了平滑迁移过渡的方案,龙蜥社区就是在这样的背景下应运而生,社区在操作系统的性能,安全性,云原生支持,运维等各个领域进行了自主创新。与龙蜥操作系统定位略有不同,欧拉操作系统(Euler OS)并未将兼容CentOS作为主要
189、目标,希望通过社区创新,打造自主的面向数字基础设施的开源操作系统,欧拉社区作为另外一个国产操作系统社区的代表,成为了一个独立发展生态的社区。OpenCloudOS则致力于打造一个完全中立、全面开放、安全稳定、高性能的操作系统及生态,在云原生、稳定性、性能、硬件支持等方面有一定的技术支撑,可以平等全面地支持所有硬件平台。OpenHarmony,开放原子开源基金会旗下另外一个重要的开源操作系统,与其他基于Linux的操作系统不同,一开始就致力于构建一个全新,自主的系统架构和生态,目标是面向全场景、全连接、全智能时代、基于开源的方式,搭建一个智能终端设备操作系统的框架和平台,促进万物互联产业的繁荣发
190、展。目前OpenHarmony在物联网(IoT)和嵌入式领域得到了长足发展,生态繁荣,社区参与者覆盖面很广。在桌面操作系统领域,尽管随着时间的推移,越来越多的用户开始使用Linux桌面操作系统,但与Windows和macOS相比,Linux桌面用户的数量仍然相对较少。根据各种市场调查,全球Linux桌面市场份额大约在24。中国桌面Linux的市场情况与全球大体一致,同时在国产化和信创的政策推动下,国产桌面Linux操作系统在政企办公OA,金融,能源,电力等领域得到长足的发展。主要的国产桌面操作系统厂商包括统信,麒麟,红旗,中科方德,普华,中兴新支点等,同时也出现了OpenKylin这样专注于桌
191、面操作系统的开源技术社区。从生态上看,应用软件特别是专业应用软件的缺失,硬件(包括显卡驱动,指纹识别器和一些特殊硬件等)驱动支持不足仍然是制约国内桌面Linux操作系统普及的重要原因。3.3.2 开源芯片在开源软件大生态中,开源芯片尚处于起步阶段,但发展势头迅猛,基于开源指令集RISC-的开源2023 中国开源发展蓝皮书82芯片生态正在快速崛起,为包括中国在内的广大发展中国家突破芯片领域的技术壁垒和市场壁垒带来了新机遇。它不仅能够协同全球各国特别是众多发展中国家共同构建开源处理器芯片生态,开拓新兴应用市场。也是一种突破处理器芯片垄断格局的新路线,有望形成普惠世界的芯片领域的“人类命运共同体”。
192、2015年才逐渐兴起的RISC-V架构,经过仅仅8年时间的发展,就大有与X86、ARM三分天下之势。截至2022年底,全球有数万名工程师致力于RISC-V计划,基于RISC-V架构的处理器出货量已超过100亿颗,预计2025年,RISC-V芯片出货量将超过800亿颗。中国成为了RISC-V最为活跃的地区,也为推动全球范围内RISC-V的发展做出了贡献。今年3月,阿里平头哥在生态大会上公布了其对RISC-V生态体系的支持计划。当前开源芯片发展突出的趋势:RISC-V不仅在工业控制、物联网、智能家居等对算力要求不高的领域已经占据主流市场,也正在向对算力有更高需求的移动设备、桌面应用、边缘计算等领域
193、发展;RISC-V在数据中心服务器市场开始起步,比如微核芯推出对标ARM服务器端处理器核的RISC-V处理器核;与X86、ARM在服务器领域提供通用芯片服务不同,RISC-V能够根据用户的应用场景进行定向的改进、优化,以给客户提供最优的解决方案;未来在云计算平台上,X86、ARM、RISC-V三方可以优势互补。国产开源芯片面临的主要挑战在于如何基于可控供应链实现具备全球竞争力的高性能芯片。过去高性能芯片往往依赖于工艺进步来实现产品性能的升级。当前背景下,高性能芯片产品和先进工艺被限制封锁,中国高性能芯片产业必须进行供应链重组。对于中国的高性能芯片产品来说,难度在于如何在可控供应链条件下满足日益
194、增长的算力需求,同时还有足够的商业竞争力应对全球竞争。一方面国产芯片只能使用落后国际先进工艺两三代以上的成熟工艺。另一方面目前高性能领域的商用处理器IP都是基于最先进的目标工艺(例如7nm、5nm、甚至3nm)开发的,这些商用IP在国内可控供应链条件下(12nm、14nm工艺)很难实现最优化的性能指标。国产高性能芯片必须走出自己的独立自主开发之路。但开源芯片的市场空间广阔。从高端的数据中心芯片,到桌面,到高端嵌入式,都需要开源芯片。2023 中国开源发展蓝皮书83从宏观角度分析,开源的真正价值在于能够带动整个信息产业的发展。通过开源模式,用户企业都能够学习和了解高性能芯片技术,能够有能力和可能
195、参与到芯片的定义和设计中,形成产业合力,完成产业升级和信息化。从微观角度看,开源芯片模式能够大幅度降低企业对高性能芯片技术的试用使用成本,因此有利于技术推广,扩大市场规模。过去开源软件的发展已经证明了这一点。基于完全掌控在商业公司手中的闭源处理器IP,对用户企业的发展是一种限制,更是一种隐患,任何一家企业都不愿意把自己的未来与另一家不可控的商业公司紧密绑定。过去两三年IC产业的混乱也证明闭源模式已经不适于整个信息产业的发展。而开源解决了商业企业的信息安全可控问题。基于这点,很多用户企业会主动拥抱开源的RISC-V和开源高性能处理器,主动共建生态,这也是开源的最大优势!对于国产高性能芯片来说,如
196、果希望在可控供应链条件下实现足够商业竞争力的芯片产品,唯一的机会就在于与应用需求的深入结合。在特定行业的专用领域专项性能方面,即便使用相对不够先进的工艺,也完全有可能以相对低的代价和成本实现领域内绝对性能的超越。对于RISC-V产业来说,只有以与应用需求结合作为抓手,才能从点到面,逐渐将RISC-V的生态丰富成熟。因此对于国产开源芯片的发展建议如下:构建开放的生态体系,聚集各行各业的力量,通过与行业应用的深度结合,从需求端引导芯片生态的发展,以中国庞大的市场需求为基础,获取新兴产业的主导权和话语权,最终成就中国独立自主的半导体产业。要想让用户敢用会用最终好用,首先必须有行业应用的机会,在某些行
197、业领域率先落地,进行应用示范。建议在政策强有力的支持下,通过政府搭台,应用引导,企业合作以完成产业升级,在解决国家战略需求的同时,完成行业企业的技术升级和创新发展。3.3.3 开源与数据库早在20世纪50年代,互联网技术(ARPANET)的先驱们就十分推崇同行评审和开放反馈,用户组通过共享源代码,相互扶持并激发创新,到20世纪90年代互联网诞生时,协作、开放、创新的价值观就已植根于互联网的内核之中。在数据库技术领域,始于20世纪70年代的Ingres项目,代码使用BSD许可证分发,在其基础之上,以2023 中国开源发展蓝皮书84各种形式演绎出包括Sybase、Microsoft SQL Ser
198、ver、NonSTOP SQL、Informix、PostgreSQL等著名产品,成为数据库历史上最成功的项目之一。本质上,开源软件和闭源软件都只是一种软件研发和消费模式,在不同时期和场景有着各自独特的竞争力与优势体现。时至今日,开源软件依托其社区开发模式,能更快地实现产品迭代和用户触达,进而形成免费软件结合付费服务的业务模式,并进一步通过云获得价值回报,MongoDB等数据库都在探索这一模式。此外,从市场竞争战略来看,软件开源已经成为后来者扩大其市场影响力、追赶头部企业的重要手段。国内开源数据库的发展,经历了借鉴、发展、创新的全历程,早期国产数据库的探索者人大金仓就是以PostgreSQL为
199、基础,在国产数据库的发展中,基于PostgreSQL开源路线的产品,成为了一支主要流派,其中以瀚高数据库发展时间最为悠久,在充分掌握PostgreSQL核心代码并逐步发展后,通过二次开源的方式发展自主ivorySQL开源社区,借助社区提供源源不断的技术迭代能力。而NewSQL的代表产品TiDB则是源自2013年Google Spanner/F1论文的技术实现,更多的NoSQL数据库也相继开源,如悦数科技在2019年开源了它的原生图数据库Nebula Graph的alpha版。自2019年以来,国内开源数据库领域快速发展,大事件频现,推动国内开源产业的蓬勃兴盛。据DB-Engines的数据显示,
200、2021年1月,开源数据库的流行度首次超过商业数据库,并持续领先,截止到2023年5月,开源数据库的流行度继续扩大了相对商业数据库的优势。全球383款数据库中,开DB-Engines商业数据库和开源数据库流行度趋势对比2023 中国开源发展蓝皮书85源数据库占据51.7%,排名前十的数据库中,开源数据库占据六席。据墨天轮的中国数据库流行度排行榜,198个数据库产品中包含13个开源的数据库产品,而榜单的前十名就有5个开源产品。从数据库开源项目的现状来看,全球最受欢迎的两种开源数据库MySQL与PostgreSQL是一系列数据库产品衍生的基础,中国数据库流行度排行榜中,源自MySQL和Postgr
201、eSQL的数据库数量分别为12和18。在今天的数据库领域,开源已经成为主要的趋势和潮流。特别是基于PostgreSQL的开源数据库项目,由于在供应链安全性和开源协议的商业友好性方面更具优势,未来发展趋势进一步被看好。2015年以后,中国的开源数据库项目进一步发展并逐渐成熟。一些项目已经在技术上取得了重大突破,并在国内外获得了广泛的认可和应用。主要的代表有TiDB(HTAP分布式数据库)、OceanBase(分布式数据库)、IvorySQL(关系型数据库)等在国际上逐渐崭露头角。同时,中国开源数据库项目的社区规模不断扩大,国际影响力逐渐增强。各个数据库项目的社区活跃度提升,开发者数量增加,贡献者
202、不断涌现。同时,中国开源数据库项目也开始积极参与国际标准制定和国际合作,加强与国际数据库社区的交流与合作。逐步开启了中国开源社区的国际化阶段。未来,中国开源数据库项目有望继续发展,为国内外用户提供更多高质量、高性能的开源数据库解决方案。项目名称项目地址项目简介TiDBhttps:/ 平扩容或缩容、金融级高可用、实时HTAP、云原生分布式、兼容 MySQL5.7协议和MySQL生态等重要特性。ApacheDorishttps:/ p e n g a u s s-m i r r o r/openGauss-serveropenGauss是一款由华为在2020年开源的关系型数据库管理系统,采用木兰宽
203、松许可证v2发行,深度融合了华为在数据库领域的企业级经验,打造国内根社区。P o l a r D B-f O r-PostgreSQLhttps:/ 中国开源发展蓝皮书863.3.4 开源与人工智能大型自然语言处理预训练模型发展情况近年来,随着深度学习的发展和大规模数据的积累,自然语言模型的规模和性能都有了显著的提升。2022年11月,OpenAI发布正式发布ChatGPT,仅仅2个月后,其成为迄今为止用户数最快破亿的应用,使自然语言处理(NLP)及大型自然语言模型(LLM)成为2023年最受关注的科技话题。自然语言模型的应用已进入快速发展和变革的时期,对高校学习、科研、产业应用、投融资等各社
204、会组织活动将产生重大影响。为了把握新一轮科技革命和产业变革机遇,推动我国人工智能事业高质量发展,中国早在“十四五”期间制定了“十四五”智能制造发展规划等一系列顶层设计文件,并从多个方面给予了政策扶持和资源投入。(一)政策扶持加强基础研究和应用研究:国务院办公厅关于全面加强新时代语言文字工作的意见提出进一步推进计算机视觉、智能语音处理、生物特征识别、自然语言理解、智能决策控制以及新型人机交互等关键技术的研发和产业化,支持语言文字基础研究和应用研究,鼓励学科交叉,完善相关学科体系建设。支持产业创新和转化:促进新一代人工智能产业发展三年行动计划(2018-2020年)提出大力推动语言文字与人工智能、
205、大数据、云计算等信息技术的深度融合,加强人工智能环境下自然语言处理等关键问题研究和原创技术研发,加强语言技术成果转化及推广应用,支持创业创新。促进多领域多场景应用:以2021年我国智能语音产业相关政策规划汇总为例,梳理了我国部分地区出台的多项政策规划,鼓励开发自然语言处理和自然语言大模型在教育、文化、媒体、司法、医疗等行业领域的应用,并基于在具体场景中的使用,形成“使用开发研究”的反馈链路,加速中国主导的开源数据库TBasehttps:/ 时序数据管理系统,2014年项目启动,2018年成为中国高校首个进入Apache孵化器的项目。2023 中国开源发展蓝皮书87基础研究与应用开发。(二)科研
206、投入以鹏城实验室、智源研究院为代表的一系列科研机构的建立,进行重点攻关大规模自然语言处理领域的核心技术,逐步形成了以悟道、鹏程盘古为代表的自然语言模型,并向产学研各界开放使用,有效促进了我国科研领域组织与人才在自然语言处理和语言模型方面不断努力和创新。国内的顶级高校,如清华大学、北京大学、复旦大学等知名高校已经成立了专门的自然语言实验室或研究组织,致力于自然语言处理和语言模型方面的研究和应用。如近期上线并开源的MOSS和ChatGLM-6B分别来自于复旦大学的邱锡鹏教授团队和清华大学孵化的智谱AI团队。在全球知名顶会期刊中,我国开发者体量、国内论文投递量及收录量也在逐年提高,根据斯坦福大学的A
207、I Index统计,自2017年开始统计以来,中国AI相关的研发活力始终处于世界第二的位置;以ACL 2021为例,共有1239篇论文投稿来自中国大陆,其中251篇被接收,接收率为20.3%。(三)大模型现状中国作为世界上最大的中文使用国家,也在积极探索大型语言模型的研究和应用。截至2023年5月,国内已有超过30个大模型项目发布,其中,包含通用大型预训练语言模型,如腾讯的混元、阿里巴巴的通义千问、百度的文心、鹏程盘古、华为的盘古、智源的悟道和IDEA的封神榜-姜子牙,也包括源自垂直领域如教育行业的网易有道的子曰,学而思的MathGPT等项目。以上模型基于不同的架构和数据集进行了预训练,并且在
208、不同领域展示了其强大的生成和理解能力。下面对部分模型进行简要介绍:文心:文心大模型是百度为主体发布的产业级知识增强大模型,能够理解和生成自然语言,同时结合知识图谱,提升了学习效率和可解释性。文心大模型包括多个子模型,如ERNIE、PLATO、鹏城-百度文心等,分别在语言理解、文本生成、跨模态语义理解、对话互动等领域取得多项技术突破。其中鹏城-百度文心是全球首个知识增强千亿大模型,参数规模达到2600亿,在60多项典型任务中取得了世界领先效果,在各类AI应用场景中均具备极强的泛化能力。悟道:悟道是北京智源人工智能研究院开发的一系列超大规模预训练语言模型,包括悟道1.0和悟道2.0。悟道2.0于2
209、021年6月发布,参数量达到1.75万亿,并在世界公认的9项 Benchmark 上达到了世界第一,在多项基准测试中超越OpenAI GPT-3、DALLE以及Google ALIGN等先进模型;除此之外,2023 中国开源发展蓝皮书88智源通过FlagAI开源平台,将悟道GLM正式开源。盘古:华为盘古大模型是循环智能与华为云联合推出千亿参数中文语言预训练模型,鹏城实验室提供算力支持。华为盘古是2020年4月25日发布的Transformer encoder-decoder的中文理解模型,在权威的中文语言理解测评基准CLUE榜单中,总成绩及阅读理解、分类任务单项均排名第一。而鹏程盘古大模型是鹏
210、城实验室与华为联合研发的全球首个完全开源开放、以中文为核心的两千亿参国产大模型概览2023 中国开源发展蓝皮书89数的预训练生成语言模型,包括鹏程盘古、鹏程盘古增强版、鹏程盘古多语言大模型和鹏程盘古对话生成大模型。混元:该模型在国内最权威的自然语言理解任务榜单CLUE上取得了优异的成绩,并且已经成功应用于腾讯广告、搜索、对话等多个核心业务场景。2022年底,混元1T大模型利用腾讯太极机器学习平台的高效算力和低成本网络,用千亿模型热启动的情况下,可以在256张显卡上一天内完成训练。通义千问:2023年4月,阿里正式发布“通义千问”,该模型基于10万亿级参数的大模型底座M6模型。该模型在电商、制造
211、业、文学艺术、科学研究等领域有广泛应用前景,并且已经实现了商业化落地。封神榜-姜子牙:2023年5月17日,IDEA研究院发布“姜子牙通用大模型V1”,姜子牙通用大模型v1(Ziya-LLaMA-13B-v1)拥有130亿参数,从LLaMA-13B开始重新构建中文词表,进行千亿token量级的已知的最大规模继续预训练,使模型具备原生中文能力。再经过500万条多任务样本的有监督微调(SFT)和综合人类反馈训练,进一步激发和加强各种AI任务能力。知海图AI:2023年4月,面壁科技与知乎合作的知海图AI正式发布,该项目在开源的双语预训练语言模型CPM-Bee基础上进行研发。值得一提的是,作为参数量
212、10B的CPM-Bee模型,不仅有十余种原生能力,更是具有强大的通用语言能力。CPM-Bee模型于2023年1月15日在 ZeroCLUE 榜单上登顶榜首。GLM-130B及ChatGLM:GLM-130B是清华大学发布的预训练语言模型,具有1300亿个参数。根据其官网介绍,该模型不仅支持中文和英文双语,两种语言的精度均于发布时对比其他模型具有明显优势,除此之外,GLM-130B具备快速且基本无损推理的能力,并兼容包括昇腾NPU、英伟达GPU、海光DCU等多种架构的智能计算芯片。2023年3月,对话模型ChatGLM-6B及千亿对话模型ChatGLM由智谱AI(由清华大学计算机系技术成果转化而
213、来)正式发布。MOSS:2023年2月由复旦大学邱锡鹏教授团队正式发布,并于4月正式上线并开源。开源代码涵盖模型训练和推理代码,开源数据包括超100万条对话训练数据,开源模型包括160亿参数中英双语基座语言模型、对话模型及插件增强的对话模型。要想大模型蓬勃发展,仍需在以下几大方面继续努力。提升算力水平:算力是支撑大规模预训练语言模型训练和部署的关键因素。因此,集中力量建设“中国算力网”,像使用电力一样使用算力,将成为未来我国人工智能基础建设中的重要一环。一方面赋能用户根据需求灵活获取和使用各种类型和规模的AI算力服务,降低人工智能应用开发和部署的门2023 中国开源发展蓝皮书90槛和成本;另一
214、方面也使得大规模算力跨区域协同计算成为可能,为我国人工智能产业发展提供强有力的支撑。加强数据资源建设:数据是训练大规模预训练语言模型不可或缺的基础,如何建立我国的数据标准以及数据工程化实现方案对于提升我国在自然语言处理及语言大模型成果产生方面,将产生重大意义。探索新颖有效的模型架构:ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言模型性能和泛化能力的核心要素。诸如多头注意力机制的改进、深度残差网络的优化、人类反馈强化学习(RLHF)的应用以及在多模态数据处理及应用方面的探索和尝试,均对新一代大模型的产生,提供了巨大的支持。(四)增强开放协作截至2023年5月,OpenAI仍
215、未对GPT-3.5及GPT-4进行开源计划的发布,限制了其他研究者基于此的改进和创新,阻碍了模型的可解释性,也增加了模型被滥用和误用的风险。基于此,我国可以充分发挥制度优势,在中立机构的组织和协调下,团结各研究和开发力量,整合算力、数据资源,以开源开放方式进行大模型的研究与开发工作。通过建立统一的标准和规范,也可以有效地保护用户隐私、维护网络安全、防止信息偏见和歧视等问题。3.3.5 开源与云计算云计算如今已是IT业界的主流技术,越来越多的用户选择云计算平台作为自己软件业务的基础设施,而云计算业务带来的IT产业营收比重也越发凸显。云计算的概念从上世纪八十年代发端,到真正成型落地广为人知,开源理
216、念和开源软件在其中起到了决定性的推动作用。系统软件里,以Linux为代表的开源的操作系统是云计算软件技术栈里坚实的基础,开源的虚拟化技术对于计算资源的池化也是必不可少的一环,包括Xen,KVM,QEMU等开源项目。在网络技术软件栈和存储技术软件栈里,各种逐渐成熟的开源技术和开放标准,也加速了云计算时代的到来。作为云计算产业的先锋Amazon AWS,就架构在这一系列的开源软件之上。在AWS稳定的技术表现和成功的商业模式的带动下,一系列开源的云计算基础架构管理软件风起云涌,而时至今日,OpenStack最终成为最成功和唯一事实上的标准云基础设施开放平台。同时,在过去几年里,容器化和容器资源的管理
217、,也逐渐走向成熟,并快速被广大开发人员和厂商所采用,也标志了云(计算)原生时代的到来。在此中起关键作用的还是几个核心的开源软件项目,首先是Linux kernel里的几个核心技术带来了容器化的可能,随后Docker工具横空出世让业界快速拥抱了容器技2023 中国开源发展蓝皮书91术,容器资源从单节点走向大规模集群的过程中,Kubernetes渐渐成为了容器资源调度和编排的事实标准,可称为云原生时代的云操作系统。存储服务支撑了应用的状态、数据的持久化,是应用得以运行的基础。云原生存储是一种用于云原生环境的存储技术,是云原生的重要组成部分,特征主要包括可用性、可扩展性、高性能、一致性以及持久性等。
218、近年来我国出现了一批优秀成熟的开源云原生存储项目,具有代表性的有PingCAP的分布式事务键值数据库TiKV,阿里巴巴的云原生镜像分发系统Dragonfly和分布式内存数据管理引擎Vineyard,以及OPPO为大规模容器平台设计的分布式文件系统CubeFS等。2022年,随着云基础设施、网络和存储等技术发展的深入,以及以容器和微服务为代表的云原生技术兴起,云计算的发展呈现出如下的趋势,也带来了新的挑战与机遇。绿色云计算成为重要议题中国信息通信研究院泰尔系统实验室联合IBM,在2023年1月5日发布的可持续计算蓝皮报告(2022年)指出:在IT计算领域,可持续计算是以优化清洁产能、提升计算水平
219、、保障不间断服务、快速响应安全事件为目标,包含可持续计算基础设施、云计算技术与平台、可持续业务应用成为可持续计算三个要素,覆盖IT软硬件、配套设施、业务应用,囊括了规划、设计、开发、运行、维护、升级、废弃回收的全周期活动。随着云计算的普及,数据中心作为云计算的基础设施,消耗大量电力并产生大量温室气体排放,能耗和碳排放问题日益严重,政府、企业和公众对此越来越关注,绿色云计算成为一个重要的议题。它的定义是利用技术突破来推动计算和其他IT资源的可持续发展,以实现可能的环境优势。与可持续计算目标一致。支撑人工智能和机器学习蓬勃发展2022年,ChatGPT的流行把人工智能发展推向了新高潮。在这个爆发式
220、增长的行业里,云计算为工智能和机器学习提供了基础算力服务。云计算提供商如谷歌、亚马逊和微软,不仅提供了一系列预构建的人工智能和机器学习服务AI-as-a-Service(AIaaS),如语音识别、图像识别和自然语言处理等,使企业能够轻松集成和部署AI功能,而且还提供了强大的分布式计算能力,支持在多台计算机上并行执行机器学习训练任务,从而缩短训练时间。除此之外,云计算提供商还提供了基于GPU和专用AI芯片(如谷歌TPU)的计算资源,为AI提供了强大的计算能力。2023 中国开源发展蓝皮书92云原生是云计算发展主线在云下半场中,如火如荼的云原生技术是云计算发展的主线。在CNCF基金会对云原生技术的
221、解释中提到,云原生要用一个开源软件栈解决三个问题:一是把软件应用程序切分为多个微服务;二是把每个部分打包成容器;三是动态地编排这些容器以优化系统资源。因此,把一个单体软件应用解耦成许多微服务,并让这些微服务在各自的容器中高效协作,是云原生的重要内容和发展方向。相对于物理机和虚拟机而言,容器是很轻量化的技术,在等量资源的基础上能创建出更多的容器实例是当下紧迫需求。简单且高效地管理快速增长的容器实例,是容器编排系统的主要任务,而Kubernetes就是容器编排和管理系统中的最佳选择。未来,随着云原生技术的成熟和发展,企业会更多地采用云原生技术,而Kubernetes可能会继续发展,成为云原生应用部
222、署和管理的事实标准。云安全将成为关键领域云计算的基础是资源共享,随着越来越多的企业将其基础设施迁移到云端,云安全将成为关键领域。云提供商可能会继续加大投资以确保客户的数据安全,并采取更严格的合规和隐私政策。数据在使用态时的保护正亟需新的技术填补空白。机密计算(Confidential Computing)正是基于硬件的受信任执行环境中执行计算来保护正在使用的数据,它基于建立硬件的可信执行环境(Trusted Execution Environment,TEE),如英特尔SGX和TDX,ARM TrustZone,AMD SEV/SEV-ES/SEV-SNP、RISC-V Keystone等技术
223、,为数据在云原生环境中的安全使用提供保障。随着容器化和微服务架构的普及,确保这些技术的安全性可能会成为一个关键议题。目前在CNCF中就有Inclavare Containers和 Confidential Containers等开源机密计算项目,它们已经成为云安全的新趋势。5G与云计算融合蕴含巨大潜力5G(第五代移动通信技术)和云计算的结合为各种行业和应用带来了巨大的潜力。同时创造出全新的应用场景。譬如,边缘计算是一种将计算资源和服务部署在网络边缘(靠近数据源或用户)的技术,在某种意义上可以认为是云计算的扩展和延伸。5G的低延迟特性使得边缘计算成为现实,但是构建分布式边缘计算基础设施工具和架构
224、仍处于初级阶段,仍有诸多问题有待解决。国内厂商发起的KubeEdge、OpenYurt、SuperEdge等开源项目继续推进,通过边缘自治,云边流量治理,边缘设备管理等功能来实现云边协同。边缘计算可以减少数据传输延迟,提高实时性能,特别适用于自动驾驶、工业自动化、增强现实(AR)和虚拟现实(VR)等应用场景,这些边缘应用场景都是5G与云计算融合的典型案例。2023 中国开源发展蓝皮书93再譬如,在物联网(IoT)领域,与云计算相结合,物联网应用可以实现更高的数据处理能力、智能分析和远程管理,这对于智能城市、智能交通和智能家居等领域具有重要意义。可以说,5G和云计算的融合将成为推动数字化转型和智
225、能化发展的关键力量。3.3.6 开源与区块链区块链技术是融合共识机制、密码学算法、智能合约的分布式账本技术,具备可追溯、不可篡改、公开透明等特性。区块链技术概念起源于比特币白皮书,但由于比特币系统技术栈中脚本语言的可编程性限制,早期的区块链生态局限在以比特币为代表的多个独立数字货币系统。2015年,以太坊系统引入图灵完备的通用编程语言作为合约开发语言,以太坊上快速涌现出一批数字资产驱动的金融类创新项目。区块链技术的迅猛发展得到各国政府和产学研界的广泛关注,在政策支持及市场驱动下,国内外诞生了一批拥有不同技术特点的区块链底层平台,应用场景也从金融领域拓展到各行各业。区块链底层平台(以下简称区块链
226、平台)是搭建区块链系统的关键基础设施,提供网络通信、分布式共识、合约执行、数据存储等基础功能,为各行业区块链应用落地提供支持。本文对比了国内区块链开源平台与具备一定影响力的国外区块链开源平台。由于本文重点关注我国区块链开源进展,国内区块链开源平台通过汇总行业白皮书、区块链信息服务备案文件、可信区块链测评、公开征集等多种渠道搜集得到,而国外区块链开源平台由于数量较多,仅遴选了star数在1000以上的知名区块链平台。国内区块链开源平台基本信息2023 中国开源发展蓝皮书94可以看出,由于监管政策不同,国内外在区块链平台发展上具有明显差异。国外区块链平台发布时间较早,以公有链为主,大部分内置原生数
227、字货币,并通过经济激励建设平台生态、完善社区治理。国内区块链平台以联盟链为主,大部分是无币区块链,侧重通过行业联盟与政府力量推动平台与社区建设。国内14个区块链开源平台中,联盟链共有10个,占比71.4%,国外具有较高影响力的14个区块链开源平台中,公有链共有10个,占比71.4%。在开源协议上,Apache 2.0占据国内开源平台的主流,占比达到42.9%,国外具有影响力的区块链开源平台中,GPL 3.0协议最多,其次是Apache 2.0协议。开源协议的使用与区块链平台类别有关,多数联盟链应用场景有闭源需求,因此联盟链平台普遍采用Apache 2.0协议,例如Hyperledger Fab
228、ric,而公有链平台则希望后续使用者持续开源,更多采用GPL 3.0协议。在开发语言上,无论国内外,Go语言市场占有率遥遥领先,达到46.4%,其次是C+,占比为17.9%。由于Go语言是以太坊和Hyperledger Fabric的主要开发语言,这一定程度上反映了这两个平台的生态影响力。如后图,我们从影响力、star数、项目活跃度、最近维护时间、贡献者数量、主要贡献者数量等多个维度对国内外区块链开源项目进行比较。国外知名区块链开源平台基本信息2023 中国开源发展蓝皮书95对比可知,整体上,国内区块链开源平台影响力与国外有较大差距,在活跃度和贡献者数量上也有显著差距。国内区块链开源平台影响力
229、与活跃度(RepChain由于托管在Gitee社区,影响力和活跃度缺失;WuTongChain,INT Chain由于影响力和活跃度较低,数据缺失)国外知名区块链开源平台影响力与活跃度2023 中国开源发展蓝皮书96拥有1000个star数以上的国外区块链开源平台有14个,而国内开源平台仅有4个。国内区块链开源平台的贡献者和核心贡献者数量比国外低一个数量级,例如,ChainSQL是项目规模最大的国内开源项目,贡献者、核心贡献者分别为137和53人,而以太坊分别是837和67人。少数国内外区块链开源平台已超过两年没有维护项目代码,例如CITA、BCOS、Wutongchain、EOS、sia,其
230、中BCOS较为特殊,其开发团队后续迁移到FISCO BCOS项目。2022年,区块链平台聚焦于性能优化,完善技术栈配套组件。公有链头部平台以太坊Layer2快速发展,rollup成为主流链下扩容解决方案,吸引了超过200个项目部署,显著降低交易成本。此外,以太坊共识机制在9月从POW转向POS一事引发关注,该方案预期将解决以太坊状态数据庞大带来的网络中心化问题,并为后续的分片扩容提供基础。在联盟链上,国内开源平台技术积累趋向成熟,强调全面的信创适配,包括支持国密、国产数据库、适配国产操作系统、国产CPU等。此外,国内开源平台根据业务场景逐渐完善跨链互操作、管理运维平台、隐私保护等配套组件。在加
231、密资产应用场景上,2022年加密资产市场行情整体低迷,市值缩水严重,以DeFi为代表的热门赛道锁仓量腰斩。Terra崩盘、FTX集团申请破产等事件使投资者遭受重大损失,严重打击市场信心。尽管NFT数字藏品在年初开启了市场新一轮热度,但在年中达到峰值后持续降低。相比国外,国内的数字藏品在上半年也同样火热,但由于禁止二级市场交易与价格炒作、强调收藏属性,行业逐渐回归理性。在产业应用场景上,我国在政务协同、司法存证、供应链溯源等重点领域探索出可行的区块链应用方案,并通过开展国家区块链创新应用试点工作形成可复制推广的典型案例和做法经验。尽管我国有部分开源的区块链平台及配套组件,诞生了一批与实体行业结合
232、的落地应用,但在开源领域还面临诸多挑战:区块链行业领域尚未形成开源共识,区块链平台开源比例低、总体数量少,部分机构仅开源配套组件或开发文档,针对最核心的底层平台仍选择闭源。区块链开源项目整体缺乏影响力,活跃度偏低,缺乏具备国际知名度的区块链行业团体与开源项目。区块链开源项目的生态建设机制、社区治理机制尚不明朗,大多数项目由单家机构维护管理,行业联盟分布式协作治理程度较低。缺乏具有认可度的开源测试框架、测试工具与测试数据集,关键性能指标可对比性不足。开源已成为软件发展的主流趋势,区块链作为构建分布式可信环境的关键技术,天然地在开源土壤中2023 中国开源发展蓝皮书97孕育成长。随着区块链技术的普
233、及、软件社区对开源重视度的提升,是否开源将成为使用方选择区块链平台的重要指标。但我国在区块链开源项目的数量和质量上均有较大的提升空间。除底层平台外,开源项目方正在逐渐开源多语言SDK、跨链、控制台、开发模板等组件,以丰富开源生态,扩大开源社区影响力。尽管国内外的政策环境不同,但开放是区块链的可信基础逐渐成为区块链从业者的共识。尽管目前我国应用场景以封闭的行业联盟链为主,但未来可能会诞生更多的开放联盟链、无币公链等提升开放能力。为扩大我国区块链开源社区的影响力,建议由具备一定影响力的行业协会牵头,联合开源底层平台的项目发布方、企事业单位、行业协会等,组建区块链开源联盟,设立联盟章程,通过制定区块
234、链开源规范、举办区块链开源大会、定期发布开源发展报告等形式凝聚我国区块链开源社区力量。同时需加大政策支持,考虑由政府部门、企事业单位、行业协会等共同出资,依托开源联盟设立区块链开源基金会,为高质量开源项目提供资金支持,同时通过举办开源比赛、高校宣讲等形式普及区块链开源知识,吸引更多人加入开源社区。3.3.7 开源与元宇宙元宇宙(Metaverse)是指一个虚拟的、以实时映射仿真的、具有高度互动性和沉浸感的虚拟世界,是互联网科技发展的新阶段。元宇宙不仅是一个虚拟的空间,而且是一个由数字资产、智能合约、虚拟现实和人工智能等多种技术组成的复杂系统。随着互联网技术的快速发展和物联网技术的广泛应用,元宇
235、宙已经成为了互联网行业的热点话题,得到了政府和企业的高度关注和投入。开源世界是建立元宇宙的首选之地。元宇宙是一个从现实映射出来的虚拟世界,它需要多种技术的支持才能够成功。目前最核心的技术是人工智能、区块链和云计算,随着技术的不断发展和应用场景的不断拓展,元宇宙将实现更加丰富和多样化的应用场景。在中国,元宇宙已经成为互联网行业的热点话题,得到了政府和企业的高度关注和投入。全球范围内,元宇宙市场的规模正在逐年增长,预计在2025年内将达到500亿美元。它作为数字经济的重要组成部分,将在教育、医疗、文化娱乐、游戏、金融等领域得到广泛应用。元宇宙项目的推出标志着中国互联网行业在数字经济领域的崛起。20
236、22年,全球元宇宙市场持续稳步增长,各大公司纷纷加大投入,推动元宇宙技术不断创新和应用场景不断拓展。据IDC预计,全球元宇2023 中国开源发展蓝皮书98宙将会有十倍的增长,到2030年的一万五千亿。全球元宇宙2021-2022年度数据:全球元宇宙总用户数量:截至2021年底,全球元宇宙总用户数量已经超过了10亿,而根据最新的数据,截至2022年底,全球元宇宙总用户数量已经超过了15亿。全球元宇宙总收入:2021年全球元宇宙总收入达到了250亿美元,而到了2022年底,这一数字已经增长到了300亿美元。全球元宇宙总支出:2021年全球元宇宙总支出达到了270亿美元,而到了2022年底,这一数字
237、已经增长到了280亿美元。元宇宙相关企业数量:截至2021年底,全球范围内与元宇宙相关的企业数量已经超过了2.5万家,而到了2022年底,这一数字已经增长到了3.5万家。中国元宇宙2021-2022年度数据:中国元宇宙总用户数量:截至2021年底,中国元宇宙总用户数量已经超过了5亿,而根据最新的数据,截至2022年底,中国元宇宙总用户数量已经超过了6亿。中国元宇宙总收入:2021年中国元宇宙总收入达到了150亿美元,而到了2022年底,这一数字已经增长到了180亿美元。中国元宇宙总支出:2021年中国元宇宙总支出达到了130亿美元,而到了2022年底,这一数字已经增长到了160亿美元。中国元宇
238、宙相关企业数量:截至2021年底,中国范围内与元宇宙相关的企业数量已经超过了1.5万家,而到了2022年底,这一数字已经增长到了2.5万家。(以上数据仅供参考,具体数字可能会因为时间的推移而有所变化。提供的数据来源包括但不限于:艾媒网、中国产业信息网、前瞻网、亿欧、中商产业研究院、中国信通院、中国互联网协会、IDC圈等)在发展特点方面,2022年全球元宇宙市场呈现出了多样化、高科技、开放性等特点。在中国市场,政府和企业加大了对于元宇宙的投入和支持力度,各类应用场景不断涌现,用户数量和市场规模也不断增长。同时,各大公司也纷纷加大投入,推动元宇宙技术不断创新和应用场景不断拓展。目前,元宇宙技术仍存
239、在一些瓶颈和挑战,如虚拟现实技术的表现、延迟、体验等方面的问题。同2023 中国开源发展蓝皮书99时,也需要解决数字身份认证、数据隐私保护等方面的问题。政策风险:在政策风险方面,政府对于元宇宙的监管和管理还需要进一步加强和完善。同时,也需要加强对于数字身份认证、数据隐私保护等方面的监管和管理。市场失衡:在市场失衡方面,目前元宇宙市场还存在着内容创作者生存状况差、应用场景单一等问题。同时,也需要加强对于不同利益相关者之间的利益平衡和协调。未来,元宇宙将在数字经济和数字文化领域发挥更加重要的作用,并推动数字化社会建设。而且,元宇宙不仅可以用于娱乐和游戏,还可以用于教育、医疗、旅游等多个领域和多样化
240、的应用场景,为用户提供更全面、更丰富的服务。同时,也将带来更多的商业机遇和社会机遇。如何让中国在全球元宇宙发展且剧烈竞争的同时,找出领先的空间?构建中国特色元宇宙或许是答案。在这之前,先分析一下中国在元宇宙发展方面的优势:1 5G高速公路:利用5G技术将所有的VR实景同步到元宇宙中,实现高速传输和精准定位。2 三维的空间标准:北斗网格码标准则提供了时间和空间的标准,保证了元宇宙的准确性和稳定性。而北斗网格码跟国际的GPS有差异的技术,可留有空间发展。3 强大的硬件供应网络:中国的电商带动了整个硬件物流的简化。在中国特色元宇宙的发展下,虚实间(在线线下)的浸沉式的互动、新硬件的研发、二代智能物联
241、网的发展将成为我国的强大优势。当然,以上的三点优势也是可以被抄袭、追赶的,但以下两个优势,则是中国特色元宇宙的关键点:4 独特的中国历史文化:如果说元宇宙是未来的计算机,内容就是计算机吸引人的关键,中国拥有数千年的历史文化,可以将这些历史文化元素融入到元宇宙中,打造出独具无限内容的中国特色的元宇宙。5 户外空间的实时数据:与外国不同,我国要做一个户外数字孪生所映射出来的元宇宙空间,需要向国家申请的使用户外空间实时数据。一个具有深厚历史文化的景点若开放实时数据,会吸引全国的元宇宙开发者来参与,这就是中国特色元宇宙的核心。3.3.8 DevOpsDevOps是Dev和Ops的组合词,是开发和运营维
242、护的总称,是目前已经收到国内外公认的确保高效研发运维流程的方法。随着技术的发展,高效敏捷安全的研发诉求使得DevOps领域持续受到国内2023 中国开源发展蓝皮书100外开发者的关注。在GitLab 发布的2023 Global DevSecOps Report SeriesWhat s next in DevSecOps(GitLab 2023 DevSecOps 报告)提到这样一些数据:调研报告采访了5010名开发者,其中有56%的开发者正在使用DevOps 或 DevSecOp的方法论,比2022年的47%有所增加。而相较于同样的进行敏捷开发的方法论,只有DevOps/DevSecOps
243、 是唯一有所增长的。这也正说明了DevOps(包含DevSecOps)的受重视程度稳步上升。另一方面,中国信通院领衔联合超50家企业,其中超五成的问卷受访企业资产规模在5千万元以上,覆盖全国32个省级行政区近90个城市,发布了中国DevOps现状调查报告(2022)梳理国内DevOps实践现状,洞察中国DevOps转型新趋势,助力企业DevOps落地实践,促进全行业DevOps演进与变革,也印证了国内对于DevOps行业的关注。国外的DevOps生态工具链百家争鸣,而且功能丰富:(一)版本控制&协作开发包括:版本控制系统Git、代码托管平台GitLab、代码评审工具Gerrit、版本控制系统B
244、azaar。(二)自动化构建和测试包括:Apache Ant、JMeter、Gradle。(三)持续集成&交付包括:Jenkins、Fabric、Travis CI。(四)部署工具1.Docker:Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化。2.Chef:Chef是一个系统集成框架,为整个架构提供配置管理功能。3.Ansible:Ansible提供一种最简单的方式用于发布、管理和编排计算机系统的工具,你可在数分钟内搞定。Ansible是一个模型驱动的配置管理器,支持多节点发布、远程任务执
245、行。默认使用 SSH进行远程连接。无需在被管理节点上安装附加软件,可使用各种编程语言进行扩展。而在国内同样也有同样的DevOps 工具链生态:(一)DevOps 一体化平台1.极狐GitLab:极狐GitLab不是GitLab的中文版本,而是GitLab版本基础上融合了本土功能的中国发行版,集成了代码管理、CI/CD、项目敏捷管理、安全监控、效能管理等覆盖软件研发全生命周期的2023 中国开源发展蓝皮书101DevOps能力,公司在中国独立运营。2.CODO:企业多混合云、自动化运维、完全开源的云管理平台(二)CI/CD(持续交付、持续集成)1.JIANMU(建木):建木自动化平台以触发器、流
246、程编排、任务分发等功能为平台核心,可以应用在各类使用场景下,包括但不限于,CI/CD、DevOps、自动化运维、多业务系统集成等场景的自动化。2.flow.ci:采用三端架构,服务端、Web、Agent,支持服务端的负载均衡以提高稳定性。所有任务运行在Agent上,并可以配置任务主机来自动调度Agent提升构建速度。(三)项目管理1.禅道:禅道是一款专业的国产开源研发项目管理软件,集产品管理、项目管理、质量管理、文档管理、组织管理和事务管理于一体,完整覆盖了研发项目管理的核心流程。(四)测试可观测性1.Metersphere:一站式的开源持续测试平台,遵循GPL v3开源许可协议,涵盖测试跟踪
247、、接口测试、UI测试和性能测试等功能,全面兼容JMeter、Selenium等主流开源标准,有效助力开发和测试团队充分利用云弹性进行高度可扩展的自动化测试,加速高质量的软件交付。2.Datakit:一款开源、一体式的数据采集可观测Agent。国内的DevOps项目虽然不及国外开源项目种类丰富数量众多,但数量还是在稳步上升。DevSecOps是DevOps的下一个阶段,其目的就是为了把安全性注入到持续集成和持续交付(CI/CD)管道中,使开发团队能够以DevOps的速度应对当今所面临的一些非常紧迫的安全挑战。DevSecOps帮助软件供应链更上一个台阶,帮助开发者和研发将安全方案集成到整个软件开
248、发交付流程。面对日益复杂的开发环境,GitLab对DevOps行业的发展有这样的趋势预测:保护供应链安全将是最高优先级安全依旧是整个组织的责任,未来将进一步“左移”,并从集成开发环境(IDE)扩展到生产环境。安全左移的目的是加强软件供应链安全。2023 中国开源发展蓝皮书102同时软件供应链安全将朝着以下三个方向发展。一线工程师将在日常运维中承担更多的威胁管理职责。为了完成这一工作,开发人员需要在软件开发生命周期的每个阶段,实时了解漏洞情况和修复策略,降低生产环境中发生严重事件的可能性。安全和合规团队将把软件安全保障策略融入代码,避免因耗时的手动安全审查,拖累开发速度。一些引人瞩目的安全事件进
249、一步凸显了软件开发风险。组织将建立审计流程,更好地评估和报告SDLC 风险。这就要求组织设计好如何交付工件,以证明其开发工具链各方面部署的控件具有不变性。安全将深入DevOps教育加速DevOps向DevSecOps的演进,将安全视为DevOps培训和教育课程的重要部分,组织提供培训。AI/ML将贯穿SDLCAI将成为提高生产力的关键,DevOps团队将数字化转型和业务分析与AI相结合,才能让数字化转型真正发生。AI/ML将进一步助力研发加速、安全修复和提高自动化测试以及可观测性。价值流分析将在组织中发挥更大作用价值流分析将拓宽过去的开发工作流程,从而更全面地了解组织向其用户(内部和外部)提供
250、的价值。可观测性将左移,以实现高效的DevSecOps可观测性将在SDLC中进一步左移,在提高DevSecOps工作流效率方面发挥重大作用,包括CI/CD、基础设施成本分析和趋势预测,以实现更好的容量规划。预估中国围绕DevOps生态的开源软件提供软件也会往预测的几个方向发展。2023 中国开源发展蓝皮书103第四章 开源行业应用现状作为行业发展的重要基石,开源已经成为促进全球各行业转型升级、推动数字经济快速发展的中坚力量,行业业已形成拥抱开源、使用开源的共识。未来,开源将在传统企业展现更多的力量,而行业积极拥抱开源、引入开源软件的背后,是其业务发展导致的企业对持续变化的业务需求响应能力、软件
251、性能及成本与效率方面的考虑。出于传统行业的增长需求、市场环境的变化、客户需求的多样性等原因,传统企业自身的研发能力不足以支撑企业敏捷响应、快速迭代、开发,制约了企业的快速发展。但企业根据需求自研系统或引入外部商业软件都会带来高昂的采购成本、维护成本和人力投入。在此背景下,开源由于其开放式协作的特点,使得开发流程更为敏捷,业务需求和变化能快速得到响应,而且开源社区为企业与外部精英提供合作平台,可以解决短期内传统行业研发实力不足的问题。引入开源软件意味着企业可以基于原有开源代码自行开发或只需采购增量服务,节约时间、人力、经济成本。传统行业引入开源软件提升了企业业务竞争力,驱动了企业数字化转型,帮助
252、企业系统实现了安全性和可靠性提升。从全局角度而言,传统行业拥抱开源为其带来了新的增长机遇。据信通院在全球开源生态研究报告(2022)中指出,开源开放是数字化催生的新“创新范式”,开源通过数字技术扩散互联促进数字技术创新,进而加速数字化转型。一方面,企业通过开源开放充分集结全社会智力资源,与外部创新主体协同创新,搭建企业技术创新入口和交互平台,获得“数字化生存”的动态技术创新能力。另一方面,开源战略通过核心开源产品快速建立一个以开源技术为平台、参与者相互赋能的行业生态圈。数字企业通过开源产品,与上下游企业形成共享代码、协同开发、成本分摊的战略联盟,能够充分发挥各个企业的竞争优势与核心能力,增强企
253、业之间的资源互补,有效地扩大行业业务范围,加速行业数字化转型。4.1 开源在金融行业的应用4.1.1 2022-2023年金融行业开源发展现状开源技术已成为金融服务的重要技术支撑金融行业在强化技术掌控和提质增效的双重压力下,越来越多地选择开源技术产品作为其基础技术2023 中国开源发展蓝皮书104架构组成部分。金融行业通过开源技术支持企业核心技术框架,既能保证接轨国际主流技术,又能确保以深度参与的方式完成金融信息建设,实现从“可用”到“好用”的转变。根据北京金融科技产业联盟调研报告显示,90%的金融机构已官方应用和试用开源软件。“2022金融行业开源技术应用调查”显示,47.06%的金融机构开
254、源架构资产库系统使用开源组件和软件的清单列表数量在1000至10000之间,35.29%小于1000,另有11.76%在1万至10万之间,5.88%在10万以上。金融行业积极布局开源发展,陆续出台多项政策规范,提供金融业开源治理和生态建设基本遵循因开源技术的广泛使用,金融行业日益重视开源治理和开源生态建设,2021年10月,人民银行办公厅、中央网信办秘书局、工业和信息化部办公厅、银保监会办公厅、证监会办公厅联合发布关于规范金融业开源技术应用与发展的意见(以下简称意见)。整体从金融机构使用开源、自发开源、开源生态构建、构建标准和法律体系等4个方面提出了指导意见,并鼓励“金融机构将开源技术应用作为
255、提高核心技术自主可控能力的重要手段”、鼓励“金融机构积极参与开源生态建设”和“开展开源项目合作,实现优势互补、互利共赢、共同发展”。同年人行发布的金融科技发展规划(2022-2025)提出了要在开源生态方面“依法合规参与数字技术开源社区等创新联合体”。行业相关政策陆续出台,规范和鼓励了金融机构安全合规应用开源技术,促进了金融行业开源生态培育和发展,推动了金融机构的数字化转型。2022年金融行业开源相关标准规范陆续出台,护航金融业参与开源生态行稳致远。在行业标准方面,金融业开源软件应用管理指南 金融信息系统开源软件应用评估规范 金融业开源技术术语为进一步规范金融机构开源软件的资产管理提供了宝贵的
256、经验。金融行业开源软件评测规范、金融行业开源软件服务商评测规范为银行机构评估和选择合适的开源软件及服务商提供参考依据,保障银行业开源软件的应用安全,促使开源软件服务商提升企业竞争。金融技术产品开源项目管理指南保障金融技术产品开源管理流程的规范性和可行性,促进金融机构合法合规、拥抱开源。金融机构逐渐强化开源治理,尝试探索对外开源在内部开源治理方面,超70%的金融机构具有开源相关治理流程,其中41.18%的企业有多个开源相关治理流程,29.41%的企业有1个开源治理流程,另有29.41%的企业尚无开源治理相关流程。70.59%的公司无单独开源管理团队,17.65%的公司拥有单独开源管理团队,其中1
257、人专职,5-10人兼职;11.76%的公司具备2-3人专职,10-20人兼职的单独开源管理团队。多家大型商业银行已制定企业级开源治理流程,具备明确开源管理人员责任划分,保障开源技术的安全可控应用。例如,中国农业银行结合商业银行特点和自身实践涉及了一套融合传统和开源理念的软件管理体系和框架TOSIM2023 中国开源发展蓝皮书105(Tranditional&Open-source Software Integrated Management),规范企业内部开源管理;交通银行也根据自身企业技术架构发展,制定了开源软件管理办法、开源依赖库管理细则等,形成开源软件管理模型;浦发银行成立了开源治理配套
258、组织架构,建设了开源治理平台实现开源软件全流程、一体化、自动化管理;中国银行打造了包括开源技术架构师、开源安全专家、开源软件开发专家在内的三支专家队伍,确保高效协同;中信银行成立了专业开源治理团队,启动开源治理平台建设,实现开源资产管理线上化。在行业开源生态建设方面,金融机构逐步凝聚开源发展共识,共建行业开源平台社区生态,增强行业合作,解决共性问题,开始培育、支持开源项目孵化与推广。北京科技产业联盟组织、中国银联承建了金融开源平台(OFTP),赋能金融领域开源项目孵化,为用户提供高质量的软件源码托管平台,当前已接入70多家金融机构,承接了如金融业生僻字处里项目、金融业开源项目生态检测平台等多个
259、行业开源项目。此外联盟还发起金融业开源技术信息服务平台FOST风险信息共享计划,依托平台风险同胞服务模块,为金融机构共享已知开源漏洞及风险信息,建立了风险漏洞和安全实践的发现和共享机制,提高金融业开源技术风险防范和处置能力。在对外开源方面,部分金融机构逐渐从原来的开源技术的使用方,开始尝试输出贡献。以微众银行、网商银行、蚂蚁集团为代表的互联网银行主动拥抱开源技术,积极参与开源社区,同时,反哺社区,通过将内部孵化的产品进行开源,捐赠给开源社区。2022年蚂蚁开源可信隐私计算开源框架“隐语”、高性能图数据库TuGraph单机版、SOFAStack云原生项目。微众银行在人工智能、区块链、云计算、大数
260、据等多个领域开源33个项目。工商银行、中国银行、招商银行、浦发银行、浙商银行等参与区块链跨链陆羽开源项目;工商银行等与科技企业合作开展MySQL数据库金融分支版本项目;招商银行参与共建KubeVela项目,对外开源EasyBaaS项目和ChainHub项目;光大银行与趣链科技合作开展区块链BaaS平台跨链子平台项目。在内部开源方面,64.71%的金融机构实施了企业或集团内部开源,35.29%的企业还未实施。缺乏专门的开源管理团队和企业级的开源文化认同以及安全、商务、法律因素是内部开源的最大阻力。4.1.2 金融行业开源发展的问题与挑战金融行业开源要得到长足发展,必然面临开源领域普遍会遇到的开源
261、许可证合规风险、供应链风险、代码安全风险、自主创新风险和运维服务支持风险,各家金融机构也面临自身IT转型过程中的开源发展问题与挑战。2023 中国开源发展蓝皮书106开源许可证合规风险高许可证合规性是金融机构引入、使用、治理开源软件面临的首要问题。同时,也需要保护金融机构自身的知识产权免遭传染性许可证侵害。目前,国际公认的开源许可证91种,主流使用的许可证也有9种(截至2020年12月19日,OSI),其中大多采用英文编写,只有木兰许可证采用中文编写。金融机构需要有具备熟悉许可证特性与要求的法律法规团队支持,并建设在开源软件全生命周期内动态管理、定期扫描,发挥监控、评估等能力。缺少运维支持服务
262、风险开源软件相较闭源商业软件缺少完善的运维保障支持。对开源软件应用中出现的安全漏洞、隐私风险,金融机构需要自行分析解决。此外,金融机构对开源软件二次开发的代码,因其针对金融特定场景不具有通用性,在开源软件进行大版本升级后,金融机构仍需要重复开发、测试、上线。开源商业模式运营公司的不可持续服务风险开源软件独特的商业运营模式,使成功的开源软件几乎都由成熟商业组织推动,在无法为其商业模式带来流量、关注度等回报,或开源软件的存在对其盈利造成影响时,开源软件将面临人员投入、资金支持、代码贡献调整的风险。缺少统一安全管理风险金融行业普遍应用了成千上万的开源软件,开源软件之间的依赖关系趋于复杂,管理成本较高
263、。开源软件间安全漏洞、后门风险的连锁传播,须进行有效漏洞管理。对外参与和对外开源程度不足金融机构整体上在开源产业生态链中贡献度较低。传统银行科技团队面临的挑战更多,对外开源的内部流程更复杂、孵化时间更长。开源供应链风险层出不穷随着软件供应链开源化趋势日益明显,供应链风险也随之愈发复杂和多样化,主要包括了断供风险和攻击风险。4.1.3 金融行业开源发展前景与趋势和开源供给侧合作更加紧密2023 中国开源发展蓝皮书107金融行业开源已广泛应用,开源软件方面的专业服务需求日益旺盛,和开源商业公司、开源技术服务公司、开源软件安全服务公司、开源治理咨询公司的合作将更加紧密。生态共建步伐进一步加快金融行业
264、在意见的指导下,在北京金融科技产业联盟开源专委会的组织下,通过FOST平台和OFTP平台,将进一步分享开源技术应用经验,共享开源技术研究成果。通过各类团体,行业合作共建步伐将进一步加快。对外开源意义进一步普及各类机构在开展生态共建的基础上,将进一步了解对外开源的意义并逐步熟悉对外开源能力建设方法。4.1.4 金融行业开源发展建议金融机构应合理制定开源规划金融机构应在IT顶层规划设计,加强开源软件使用、开源治理、开源人才队伍建设方面的规划,实现开源核心技术的自主可控。金融机构应加强开源安全管理金融机构应加强开源风险意识,提升开源工作认知度和参与度,建立统一安全管理机制,破除开源引入障碍,规范开源
265、全生命周期管理,推动适合开源的组织架构调整,指导金融机构建立开源办公室,配备相应的开源法律合规团队,切实掌握开源使用规模、复杂度,对已存在的安全漏洞、许可证合规风险主动防控处理。金融机构应积极参与开源生态建设,加强开源社区互动金融机构应走出以使用为主的单方模式,在贡献开源、主动开源、开源慈善捐赠等方面主动投入和布局,加强与协会、联盟、基金会等社会组织合作,和开源社区互动,推动开源供给侧参与金融开源工作,积极参加编制开源标准,促进金融行业开源生态可持续健康发展。4.2 开源在汽车行业的应用4.2.1 2022-2023年全球汽车软件开源生态2023 中国开源发展蓝皮书1082022年,汽车行业的
266、战略技术储备通过成本及供应链的棱镜,在市场表现上展露明显,技术架构也随着软件比重及EE架构进入了新的双螺旋进化模式。目前各车企根据自身供应链条件的不同,也正处于不同的发展阶段。软件定义汽车正在通过软件的技术、基础技术的普及、科技团队的引入影响汽车行业,促使整个行业进入到一个新的发展阶段。基于以上的行业发展趋势,软件的比重在汽车研发时间以及成本上均上升迅速,据麦肯锡的预测,到2030年软件的比例将达到30%。2025年汽车软件的市场规模将达到620亿美元,尤其是网络,车用芯片,V2X架构以及云端基础设施的完善,“硬件预置、软件解锁”的产品策略将会出现在汽车的多个功能域中。要做好灵活的上层架构,需
267、要在性能强大的硬件架构基础上,有一个“可编程”“安全成熟”“生态丰富”的车用操作系统。因此,车用操作系统成为车企核心竞争力的基石。但由于底层操作系统的投入巨大,产出不明确,现在大多数车企还是采用了商业化的成熟产品,比如QNX、VXWorks等,成熟产品的好处是可以非常高效地完成汽车的研发。但这些都基于相对固定的供应链体系,如果想要在产品设计上有丰富的扩展性和灵活性,使用商业软件,需要付出昂贵的成本以及可能存在的供应链被控风险,因此,还有很多厂商,投入了巨大的研发进行“全栈自研”,鲜有成功的案例。从产业角度来看,需要有一种方式联合操作系统的硬件环境,需要熟悉操作系统的科技公司和科研机构进行合力共
268、建,对产业共性的问题进行解决,当然,还有很多的中间件以及工具,也是重要的基汽车技术架构进入双螺旋进化模式2023 中国开源发展蓝皮书109础软件。2022年涌现了非常多的组织,例如OpenSDV、Eclipse的SDV工作组,中国智能网联汽车产业创新联盟的基础软件工作组等等。大家都在寻求一种新的共建模式,需要有一定的组织形式,有共同的代码共享存储,有活跃的参与者组成的社区,这就是产业需求衍生的开源模式。汽车因为供应链很长,涉及面非常广,汽车软件的复杂度也很高。同时,随着开源软件的引用、供应商大量使用开源中间件或组件进行交付,在车企进行SBOM管理时迎来了巨大的挑战,需要有一个跨部门、跨组织、跨
269、权限的协调组织出现,进行资源、流程的配置与管理,因此,开始引入了OSPO(Open Source Program Office)。这在大型互联网企业相对成熟,对于企业在使用外部开源组件/项目的合规,以及代码开源到外部的流程负责,协调研发、产品、市场、法务、人力进行综合的管理,在用好开源的同时,也遵循开源世界的游戏规则,更好地融入其中。比如在2022年7月,极氪汽车成立了自己的OSPO,取名为极氪开源合规审查小组。在同期,长安也正在考察开源软件办公室的作用和意义,最终还是以知识产权相关部门为驱动,在合规上进行把关。4.2.2 问题、机遇与挑战从当前的生产模式和电子电气架构在大多数车厂的发展阶段,
270、车企在整体开源生态上,还是一个使用者的角度,Tire1和Tire2厂商在基础技术的投入、技术要更深入。从车企以及软件供应商和集成解决方案的提供商来说,需要从引入开源软件或组件入手,逐渐规范起来,迎接开源带来的无限可能,也正视可能的风险。开源合规与供应链安全根据新思科技发布的2023年开源安全和风险分析报告,2022年,在汽车所在领域(航空航天/汽车/运输和物流),100%的代码库包含开源代码,开源代码占所有代码的73%;65%左右的代码库包含许可证冲突(远高于全体样本的53%);63%的代码库包含高风险漏洞(远高于全体样本的48%)。2022年9月,美国发布了备忘录(M-22-18)通过安全的
271、软件开发实践增强软件供应链的安全性,欧盟发布了提案关于具有数字元素的产品的横向网络安全要求(网络弹性法案),对软件安全提出了相关要求,涉及符合性声明、软件材料清单(SBOM)、漏洞处理流程、第三方评估等多个方面。在这种情况下,即使没有海外法规的倒逼,我们也应该关注到使用或应用开源可能存在以下风险:可能会有安全漏洞;可能在整合过程中出现Bug;可能存在潜在的合规性问题,例如许可证和出口管制风险。2023 中国开源发展蓝皮书110针对上述几个现状问题,开源软件的规范化使用以及合理的开源协议的使用,要尽可能地减少风险以及为应对海内外法案做好前置准备:合理地建立开源组件的白名单机制,从可信的托管服务商
272、或基金会取得高质量、有限的开源组件;增加对于公司开源加密算法数据库管理的要求,以及加密算法审查备案机制;安全团队记录使用的组件来源,做好SBOM动态采编,并跟踪组件的漏洞报告,明确和优化组件选型和进入流程;法务团队了解该组件的法律合规需求,并提出风险建议,目前企业在开源软件的合规性问题上,主要关注许可证风险和出口管制风险。前者主要是开源风险、知识产权风险、对外展示风险。后者在于开源加密算法的使用;通过组建专门的或虚拟的OSPO团队,从各部门协助监控整个流程的执行;在对外输出服务或发布软件时,工程师可以根据组件来源快速梳理使用的开源组件清单,并明确当前版本的漏洞闭合以及协议使用情况,了解最优及最
273、糟的安全状态,可以高效地应对安全/合规的不同场景输出。新技术探索GPT(Generative Pre-trainedTransformer)技术在多个车企内部的SOA中均有所提及,除了从应用端解决类似智能客服的问题外,如果可以训练GPT参与到代码编写过程,不仅可以规范化和模块化可靠的代码块,也可以尽可能减少人为错误。通过GPT将具有功能安全不同等级要求的代码风格,结构和关系树结合到开发流程中,开发满足功能安全要求或者适用于汽车座舱环境的代码。要达到这样的效果,需要对模型进行大量的训练,给予正确的边界理解,让GPT可以在汽车这种垂直领域的软件开发中贡献力量。这里也不可避免的需要参与单位通过开源、
274、开放的形式,在数据样本、编码要求上进行共享,促进整体行业的技术进步。4.2.3 主要问题的解决思路及建议产业的技术更迭太快,人才的储备不足通过调研,最近五年的汽车行业技术更迭,超过了过去十五年的综合。对于汽车行业的人来说,需要学习和了解软件技术,而熟悉软件技术的人,极少有熟悉汽车这种垂直行业的,因此现在人才的引2023 中国开源发展蓝皮书111入、培养、梯队都非常有挑战。但通过开源,或许是过渡时期解决人才短缺的一个可行路径:芯片企业通过低成本的模拟仿真工具,让开发者,尤其是学生开发者可以尽早的进入到这样的开发环境;车企需要通过联合实验室的形式,将汽车所需要的技术以课题抛出,让开发者可以早日接触
275、到真实需求;科技企业需要引入和参与到Tire1和车企,完成对产业的理解;开源开放,多鼓励汽车相关领域的开源社区,以不同的主题,给跨界的人才寻找也就方向,逐渐形成大的生态。合规使用开源,需要车企重视无论是外部的逼迫,或者是我们从开源生态的建设来看,都需要建设规范的使用和参与开源。在出海的需求驱动下,车企和软件供应商等需要开始储备SBOM或者相关的管理措施。需要发出源自中国供应链体系的声音,破解很多年的规则和要求底层系统的兼容性,以及外部工具软件的硬件清单,其实就是汽车供应链角度的朋友圈,国内鲜有企业能够参与决策,需要通过底层系统的开源,构建和发出可控供应链体系的声音。另外,在功能安全角度,车用系
276、统已经发生了架构上很大的变革,但是现在的判断标准还停留在几年前。我们可组织产业内的企业共建,在国际汽车供应链体系内发出声音,也通过生态企业的广泛应用,形成事实标准,推进团标、国际标准的更新迭代。4.3 开源在工业互联网的应用4.3.1 2022-2023年工业互联网开源发展现状工业互联网自2017年上升为国家战略以来,在政策与市场双轮驱动下,呈现快速发展态势,国家级双跨平台从最初的10家已经发展到29家,面向行业和专业领域的工业互联网平台更是达到几百家,体系架构也从1.0进化到2.0。2023 中国开源发展蓝皮书112工业互联网高速发展,部分功劳应归功于开源软硬件的助力。目前,工业互联网通用技
277、术领域开源项目较多、成熟度相对高,但不可忽视的是,深入到OT层、传统制造领域,开源项目相对少、成熟度也较低,且核心开源项目以国外为主。推动开源开放技术体系,对加快我国工业互联网发展具有重大意义。近年来,我国也涌现了一批优秀的工业互联网开源项目,整体呈增长态势。工业互联网边缘侧碎片化程度高,开源技术发展空间广阔工业互联网边缘侧主要是通过物联网技术实现工业设备数据接入能力、协议解析与数据预处理,整个服务市场呈现碎片化的形态,为开源技术提供了更广阔的发展空间。从通信网络、连接协议到物联软件、时序数据库,都存在大量优秀开源项目,我国开源项目表现也相当亮眼。工业互联网功能视图平台体系框架2023 中国开
278、源发展蓝皮书113在网络方面,5G开源项目较多,包括Open5Gs、Free5GC和Magma等,NB-IoT、LoRa、ZigBee等相对少。在连接协议方面,MQTT、CoAP、OPC UA、AMQP、XMPP、DDS等都是开源协议,基于标准协议的开源项目也较多,其中,中国的开源物联网MQTT服务器EMQX的全球下载量已超千万。工业协议方面,由于传统工业厂家的市场格局和商业利益,大多数工业协议都是封闭化设计,较少开源。在物联软件方面,从组件到整个平台软件都有典型开源项目,包括消息队列Kafka、Pulsar,规则引擎Node-RED、EMQ X IoT Rule Engine,开源物联网平台
279、ThingsBoard、IOT DC3、Kaa等。此外,为了物联网边缘计算构建通用开放框架,2017年6月,Linux基金会主持成立开源边缘计算框架EdgeX Foundry,提供开源微服务的集合,用于统一工业互联网边缘计算解决方案的生态系统。在时序数据库方面,近几年一直处于高速发展阶段,开源项目更是层出不穷,权威排名DB-Engines TimeSeries热度前五中,包括第一名InfluxDB在内的4个都是开源项目,国内的开源时序数据库TDengine、Apache IoT DB排名也比较靠前。工业应用开发环境逐渐转向低代码模式,开源项目正在兴起工业互联网的价值在于重构工业知识创造、扩散、
280、复用新体系。工业知识往往掌握在专业技术人员手中,低代码、零代码的工业应用开发环境为这些技术人员提供一个标准化、易用的编程环境,通过统一的编程语言,实现流程、逻辑、经验、算法、规律等工业知识的快速封装,已经成为填补技术人员的开发技能的有效工具。目前,国内低代码、零代码创业型公司和产品众多,开源项目较少,正处于兴起阶段。百度开源了amis前端框架,阿里巴巴开源低代码引擎LowCodeEngine。浪潮开源低代码内核UBML,并发布了具有完整企业级应用能力的海岳低代码平台inBuilder社区版。虽然国内低代码平台目前取得了很多不错的成果,在低代码平台开发类型上对OT类应用仍支撑不足,期待开源社区带
281、动在这方面的持续深化发展。工业数据管理领域以开源为主导,多种技术和架构并存工业数据管理与服务通过大数据技术提供面向海量工业数据提供数据治理、数据共享、数据可视化等服务,是工业互联网发挥工业大数据价值的重要一环。大数据技术与开源之间有着密不可分的关系,目前市场上应用最广泛的大数据技术栈还是以开源大数据框架Hadoop与开源通用内存并行计算框架Spark为核心的生态系统。近年来,以Hadoop为核心的开源大数据体系,逐渐向多元化技术并行发展。一方面,原有Hadoop2023 中国开源发展蓝皮书114体系的产品迭代趋于稳定,一些常见的开源组合,比如Flink+Kafka、Spark+HDFS等,经过
282、开源生态市场的检验,已经成为相对固定的标准化选择。另一方面,大数据技术生态也在向流处理、数据可视化、交互式分析等方面探索。随着云原生的发展,与云原生结合更紧密的Airbyte、Flink CDC、SeaTunnel、InLong等项目也得到了飞速发展。工业数字化工具成熟开源项目少,主要集中在欧美发达国家工业数字化工具融合数字建模、数字仿真、数字孪生等技术,提供产品、设备、工艺和系统的三维设计、仿真、展现、优化等,是工业自主可控的关键,是工业互联网的重要工具,其中,几何内核、约束求解器、3D引擎是工业数字化工具核心技术,属于高技术含量、高研发投入、高应用门槛产业,成熟技术高度集中在欧美发达国家。
283、目前全球市场上只有少数内核厂商,其中,CGM、ACIS、Parasolid、Granite属于第一梯队,分别属于法国达索(前两个)、德国西门子、美国PTC,这些技术虽然闭源,但应用广泛;Open CASCADE(OCC)是目前世界上为数不多的开源几何内核,由法国Matra Datavision公司开发,基于OCC的CAD软件有FreeCAD、HeeksCAD、AnyCAD等。在约束求解器方面,西门子的DCM是全球最成功的商用几何约束求解器,处于垄断地位,其他还包括达索的CGM、俄罗斯LEDAS的LGS,知名度也较高。因此市面上的开源约束求解器也众多,但是大多数是限定于某些细分领域或来自于研究性
284、项目,例如OpenFOAM、FEniCS、Elmer、Salome-Meca等。在3D引擎方面,国内开源项目处于空缺状态,目前主流的引擎包括商业引擎Unity Technologies公司的Unity,和开源引擎Epic Games公司的UE、Analytical Graphics公司的Cesium、Mr.doob个人开发的Three.js等,其中,UE以逼真的渲染效果著称,在游戏开发中应用较多,工业领域也有一些项目在应用UE;Unity、Cesium、Three.js在工业领域应用较广泛。国内积极探索工业模型开源开放,促进工业知识的沉淀、复用和迭代创新工业互联网的核心资源是工业模型,即工业知
285、识的模型化、标准化表达。工业模型的跨系统流转、交付、应用,极大促进了工业知识的共享与发展。统一建模语言具有领域无关的通用模型描述能力,基于统一建模语言的方法能够实现复杂系统的不同领域子系统模型间的无缝集成。欧洲仿真协会EUROSIM于1996年推出多领域统一建模语言Modelica,经过多年发展,目前Modelica标准库已经包括了不同物理领域的1600多个模型组件,基于Modelica发展出来的商业软件、开源软件也非常多,2023 中国开源发展蓝皮书115Modelica模型可以在这些软件中自由流转。除了Modelica外,工业界大部分成熟的建模工具都建有自己的模型库,例如Simulink建
286、模工具在产业界、学术界被广泛应用,自带对象模型库、算法库、控制系统、环境模型、基础元器件模型库等,但这些模型并不是免费开放的。国内工业互联网发展始终提倡加速工业知识的沉淀、复用和迭代创新,其中,同元软控通过打造工业知识模型互联平台MoHub,构建了一个覆盖函数库、模型库、App库服务的模型社区,开发者以开源方式分享到社区的模型库,支持海量用户参与到工业知识模型的开发、分享、创新应用过程。工业App基于应用商店模式加快开源开放步伐工业App是基于工业互联网,承载工业知识和经验,满足特定需求的工业应用软件,本质是企业知识和技术诀窍的模型化、模块化、标准化和软件化。开发者社区是开发工业App的主要推
287、动力,平台和微服务框架降低了工业App开发的难度和门槛,大量的开发者都可以参与开发工业App。面向特定工业应用场景,激发全社会资源形成生态,推动工业技术、经验、知识和最佳实践的模型化、软件化和封装,形成海量工业App。应用商店是向企业用户提供的工业App分发渠道,是促进工业App应用生态繁荣发展的有力支撑。在应用商店模式下,来自不同制造商的工业App可以跨平台运行,相互交互,具有一致的语义,按照共同的标准工作,并且对所有社区开发者开放。目前开发工业App的核心技术主要由国外公司把控,国内整体开源产品较弱。开源可成为颠覆传统工业App的重要武器,国内企业开始布局探索,开源意识逐渐增强,传统优势企
288、业和创新性企业加快开源布局。在应用商店模式下形成开放的应用程序生态系统后,工业App领域会向传统PC软件市场一样取得蓬勃发展。开源工业软件成果丰富,国内积极探索破局之路工业软件是工业互联网的核心力量,近年来均涌现了大量开源工业软件。在研发设计类软件方面,有开源免费的用于3D建模的FreeCAD、2D建模QCAD社区版以及基于QCAD的一个开源分支发布的LibreCAD等开源软件。目前开源CAD软件供个人使用表现的比较出色,但仍然无法在大型企业直接代替AutoCAD的直接模拟。在工业设备中常见的生产控制类软件可编程逻辑控制器(PLC)方面,OpenPLC、Beremiz、Apache PLC4X
289、等都是非常优秀的开源PLC软件。开源的ERP、CRM类业务管理软件数量也已形成规模化生态,如Odoo。我国工业软件在国家的大力扶持以及各类企业的不懈努力之下,发展步伐明显加快,但仍存在高端工业软件缺位、本土工业软件应用困难等问题。工业软件的破局之路艰难,开源不失为一种新的思路。2022年7月,开放原子全球开源峰会成立OpenAtom openCAX工作委员会,在开源领域布局了一批共性关键技术,联合构建OpenDACS开源EDA平台,2023 中国开源发展蓝皮书116聚集国内优势力量,共同探索工业软件发展新路径。工业互联网开源社区整体发展良好,与实际产业联系仍需加强目前工业互联网领域应用比较广泛
290、的开源项目,其社区发展也比较活跃,如Eclipse IoT、Linux Foundation、OPC Foundation、FreeRTOS、Zephyr等。其中,Eclipse IoT提供了基于Eclipse的开源工具,包括开发工具、测试工具、运维工具等,这些工具都能够支持工业领域的物联网应用开发和测试。Eclipse IoT的社区正在快速成长,145+的创新组织都致力于加速采用由Eclipse IoT社区开发的商业级、生产就绪的开源技术。OPC Foundation推动了OPC UA协议的发展和普及,积极参与了各种工业物联网协议的制定,提高了标准的普适性和实用性。仅2019-2022年,O
291、PC Foundation基金会成员就增加了150多名。截至目前,全球已有超过920家OPC基金会成员和数千个符合OPC标准的产品。但是,许多其他工业互联网领域的开源项目,由于没有形成实际的产业应用,发展相对滞后,仍需要进一步改进与完善。如EdgeX Foundry项目,由于其与实际工业应用场景不够贴合,该项目会员数发展至今仍低于100,且在GitHub上仅三十多人贡献了代码仓库。4.3.2 工业互联网开源发展的问题与挑战工业互联网开源要得到长足发展,必然面临开源领域普遍会遇到的供应链风险、代码安全风险、知识产权风险、自主创新风险,同时,还要解决自身领域存在的开源发展问题与挑战。平台层工具软件
292、开源运营成本高、传统商业模式获利难工业互联网平台发展迅速,国内头部厂商纷纷搭建了双跨平台,我们仔细研究这些平台,就会发现重要部件几乎都用到了开源软件。但平台型软件商业巨头,往往体量大,在市场竞争中处于优势地位,通过采用开源软件、工具搭建商业工业互联网解决方案,实现快速推广并获利,而这些开源软件、工具的创新型厂商由于体量小、整合能力有限,没有提前布局商业,再加之开源运营成本高、难以获利,往往给别人做了嫁衣,自身发展后劲不足,长此以往不利于工业互联网基础软件开源生态发展。工业互联网技术门槛高,跨大量开源组件构建平台往往导致深度整合和优化不够工业互联网融合OT、IT、CT等多个领域技术,实现深度整合
293、和优化是一件非常复杂且困难的事情,开源项目在这方面存在非常多的市场机会,开源软件、工具可以免费获取源代码,对于有一定IT能力的企业来说,具有较好的经济效益。例如大部分软件厂商、工业企业往往会选择Kubernetes、Istio、Docker等快速搭建工业互联网平台。开源软件虽然使用简单、经济,但往往也面临着“免费即最贵”2023 中国开源发展蓝皮书117的尴尬局面,开源技术的大规模商用需要充分的评估与实践,需要技术团队同时掌握很多不同领域的开源组件,并且能融会贯通、知道如何将这些组件更好地组合到一起。但大部分中小软件厂商或传统企业没有足够的专业人才,缺少融合多个开源软件系统的一整套解决方案,往
294、往面临因软件版本不统一的兼容问题、因参数配置不合适的性能问题、因缺少技术支持的运维优化困境,导致深度整合和优化不够。工业互联网各子技术领域开源发展不均,缺乏核心工具的开源工业互联网边缘层、PaaS层、应用层,由于各层功能与技术差异,其开源发展不均,国内更是少见核心工具的开源。边缘层主要提供协议解析、工业数据接入及预处理等能力,国内外开源项目较多,如设备网关接入方面有NEURON、MQTT、ThingsBoard、EMQX等开源项目,但受制于工业协议的多样性,多数开源项目都无法做到协议适配的通用性。PaaS层主要提供工业数字化工具、工业数据管理服务、工业模型管理服务等工具及通用能力,因商业用途及
295、专业工具的技术门槛高,厂商往往选择封闭发展,构建技术壁垒,核心开源项目较少,尤其三维设计、仿真优化。不过,近几年随着Open CASCADE等开源数字化工具的出现,逐渐打破了AutoCAD等主流封闭软件的垄断局面。应用层方面,传统研发设计类软件、生产控制类软件、业务管理类软件和工业数据软件中,均涌现出了大量开源软件,如开源ERP Odoo、Apache基金会旗下的Apache OFBiz项目,已经有了较大的应用生态。但从整体发展来看,工业设计类软件、工具仍需加强布局。边缘侧工控系统、协议相对封闭,影响设备的互联互通边缘侧工控设备(PLC、DCS等)以及工控协议经过20年间的发展,一方面激烈的市
296、场竞争刺激了西门子、施耐德、欧姆龙等国际厂商产品快速迭代升级,另一方面也构筑了设备互联互通的壁垒,各家厂商所采用的PLC编程和通讯交互方式不尽相同,衍生出不同类型的通信协议,虽然极大的增强了自身向上层的数据传输能力,但这些协议大部分是采用封闭设计,彼此不兼容,用户无法扩展或自定义系统、协议以满足其特定需求。目前边缘侧工控系统、协议的开源程度虽然不是很高,但还是有一些有影响力的开源项目,例如,OpenPLC是一个开源的可编程逻辑控制器,Open Industrial Linux是一个基于Linux的开源工业操作系统,还提供PLC、HMI工业自动化应用程序。4.3.3 工业互联网开源发展前景与趋势
297、当前,开源已成为工业互联网领域的重要开发模式,工业互联网各技术领域越来越多的采用开源代2023 中国开源发展蓝皮书118码,自身的开源化趋势也越来越明显。工业互联网开源正在向垂直行业解决方案、海量工业App、工业技术为主的OT层渗透。工业互联网依托开源社区与生态发展垂直行业解决方案我国石化、钢铁、电子信息、家电、机械、汽车、装备、航空航天等垂直行业广泛应用了工业互联网技术能力。各垂直行业的工业互联网实施业务场景相对独立、应用领域不尽相同,应用深度参差不齐,实施路径也存在差异,如何打造更多的垂直行业解决方案,将单独部署的工业互联网项目拓展和融合达到行业规模化,是工业互联网高速发展必须解决的问题。
298、开源社区可以使跨地区、跨领域的专业人才之间通过开放式的创新生态实现深度交互与智慧共享,让更多的人参与到垂直行业解决方案构建中,从而提高项目的数量和质量。面向垂直行业的工业模型、插件类开源项目将逐渐增多。工业App需求繁杂,低代码工具开源能够加速创新效率工业App涉及研发设计、生产制造、运维服务和经营管理等不同领域与环节,个性化强,对象众多,关系非常复杂,体系庞大且需求繁杂。低代码开发工具沉淀过去十几年策划、开发、应用工业App的经验,参考工业产品制造模式形成一些典型模型和架构模式,提供低门槛应对复杂需求的开发方案。低代码开发工具通过生态联盟,由多家企业专注其擅长的部分,彼此协同发展,可以不断积
299、累工业App模式,构建领先的产业集群。开源是建立这个生态联盟的有效方式,通过开放源代码,聚集各个行业工业App的领先厂商,彼此打通、串联,共同推动沉淀工业软件、智慧城市、智能制造等领域的低代码模型,应对繁杂的工业App需求,提供低门槛开发方案,加速工业互联网领域创新效率。工业互联网技术开源由IT层迈向OT层IT层主要涉及计算机、互联网、应用软件等,其软件系统相互连接,通常运行在iOS和Windows等流行的操作系统上,缺乏自主性,软件开发规范、使用标准解决方案以及流行的通信协议,应用场景广泛,因此开源项目较多。相比之下,OT层主要涉及机械、工控网络、工控系统以及跨工业协议的通信,系统一般是自治
300、的、隔离的、自包含的,运行在专有软件上,与传统计算机编程不同,应用场景也涉及更多专业知识和技能,因此OT层开源项目一直发展缓慢。随着IT与OT融合越来越深,OT层也开始寻求标准化的发展道路,IT与OT之间的界限正在被引入连接设备的OT系统和物联网的兴起所模糊,OT层的开源项目也会逐渐增多。2023 中国开源发展蓝皮书119工业互联网通过开源社区培养专业人才工业互联网领域开源项目蓬勃发展,开源软件的易获取性让众多高校学生、企业人才可以低成本的接受并使用开源软件,同时开源社区中汇聚了众多有着开源精神和探索精神的开源贡献者,开发者可以在社区中获取到软件源代码、与更多的业内优秀从业者进行协作、扩充个人
301、技术图谱和技术栈等,因此开源社区也成为了工业互联网领域人才培养的重要基地。高校是人才培养的重要来源,高校学生也可以通过开源社区开拓技术视野,锻炼协作能力。通过一系列的开源校园行活动可以有效推进开源文化、开源实践在高校的普及,促进高校开源人才培养、加强高校人才参与到企业开源实践,为工业互联网行业提供源源不断的人才供给。4.3.4 工业互联网开源发展建议鼓励龙头厂商积极参与工业互联网开源发展,布局重点领域的开源项目工业互联网龙头厂商是产业技术创新的主要推动者,是产业高质量发展的重要依托。工业互联网龙头厂商应积极发挥产业创新过程中的融通引领作用,参与开放原子开源基金会组织的重点开源活动、开源项目,共
302、同营造良好的工业开源文化氛围,开展产业开源顶层设计与总体规划布局,打造中国工业互联网顶级开源社区,组织引导产业链上下游企业围绕核心技术领域孵化CAX、PLC等优质工业互联网开源项目,加快形成我国工业互联网发展新优势。开源社区倡导开源文化,激发工业领域的开源氛围T层和OT层的开源空间都很广阔,但是由于两者的应用场景和技术需求不同,开源社区的重心和方向也有所不同。在IT层,由于其应用范围广泛,开源也更加活跃。比如,开放原子开源基金会、Linux、Docker、Kubernetes等受众广的基金会,以及Apache基金会下的Apache Hadoop、Apache Spark项目等大型开源项目。而在
303、OT层,出于优先保护商业利益,以及应用场景和技术需求相对专业等原因,导致整个领域的对开源的认识和开源氛围不足。未来,工业互联网各方力量应积极利用开源社区的资源和平台,重点推动工业互联网领域OT层开源活动的普及和推广,为工业企业提供更好的开源解决方案和技术支持。其次,注重高校活动实践,开展校园行、组织开源软件开发比赛、提供技术讲座等活动,提高对开源文化的认知和参与度,进而推动整个领域的开源氛围。2023 中国开源发展蓝皮书1204.4 开源在风洞等场景的应用计算流体力学(CFD,Computational Fluid Dynamics)发展对开源生态建设有重要影响。CFD兴起于20世纪60年代,
304、是流体力学与计算机科学相互融合的新兴交叉学科,主要通过计算机和数值方法来求解流体力学的控制方程,对流体力学问题进行模拟和分析。90年代初期,随着计算机性能的优化提升,加速促进了CFD仿真软件在航天设计、化工处理、半导体等重要工业领域应用。当前,以Fluent(美国ANSYS企业主导研发)为代表的商用CFD仿真软件已得到广泛应用,在国际市场的占有率高达70%。为打破商用CFD仿真软件的垄断,由英国帝国理工大学Gosman团队编写,面向公众发行的开源流体学仿真软件OpenFoam应运而生,为用户提供了可扩展的数值模拟方法和求解器,进一步丰富了软件业态。而目前,在CFD仿真软件的商业化和开源应用方面
305、,我国头部研发力量薄弱,对外依附性较强。为提升本土工业应用软件的精确度、稳定性和计算效率,国产CFD软件选择拥抱开源,通过高效的在线协同机制,汇聚广大使用者和开发者群体,利用信息化创作环境和大规模在线协同开发工具实现技术协同攻关,共同打造国产自主CFD软件生态。4.4.1 风雷软件风雷开源项目即风雷软件是中国空气动力研究与发展中心(CARDC)研发的面向流体工程的开源混合CFD平台。平台的建立遵循面向对象的设计理念,采用C+语言编程。风雷软件为了适应结构网格、非结构网格、混合网格、重叠网格等不同网格的计算,设计了具有良好通用性、可扩展性的体系结构和数据结构,实现了在同一个软件平台上,同时兼容结
306、构求解器和非结构求解器。两种求解器可独立运行,也能耦合计算,即在流场中同时含有结构网格和非结构网格的情况下,在结构网格上调用结构求解器,在非结构网格上调用非结构求解器。风雷软件作为目前全球唯一同时兼容结构/非结构的开源软件,其计算范围覆盖低速、亚跨声速和高超声速。开发过程中,以现代软件工程方法为指导,结合CFD行业特点,设计了面向下一代的软件体系结构。4.4.2 IDRLNet物理场的快速仿真与精确反演是飞行器设计和运行监测中面临的两个重要课题。在设计过程中,可以通过计算流体力学(CFD)实现物理场数值仿真。但是,CFD数值仿真往往需要消耗大量时间,在计算成本和准确性方面仍然面临许多挑战。在飞
307、行器运行过程中,性能监测涉及物理场反演,为2023 中国开源发展蓝皮书121满足实时性需求,数据驱动方法被引入其中。然而受限于传感器数量和精度,单纯数据驱动的方式并不能满足物理场的重建需求。面对这些困难,内嵌物理知识神经网络(Physics-Informed Neural Network,PINN)作为一种新兴深度学习技术,逐渐被应用到CFD领域中。PINN保持了神经网络对数据高效利用特性的同时,在神经网络中内嵌物理知识,从而实现数据与物理知识混合驱动。为解决飞行器设计优化过程中物理场快速仿真问题和运行监测阶段物理场精确反演问题,国防科技创新研究院无人系统技术研究中心、智能博弈与决策重点实验室
308、推出了基于PINN的微分方程智能求解框架IDRLnet。IDRLnet是一款以飞行器设计优化任务为应用背景、基于PyTorch开发的开源框架。IDRLnet主要包括几何生成、数据处理、神经网络构建和偏微分方程求解四大模块。该框架提供了二维与三维的基本几何对象,并支持几何对象之间的集合运算。PINN方法的基本思路是对采样配点上的数据和方程残差进行拟合,因此,面向该领域学术研究需求,几何生成模块提供了内部采样方法及其对应符号距离场(SDF)、边界采样方法及其对应法向量。数据源包括采样得到的数据节点和外部数据节点,可用于代理模型构建与逆问题求解。该框架内置了多种神经网络架构与常见微分方程,便于多种方
309、法比较研究。处理复杂物理场时可能涉及较多对象,物理方程与采样点数据之间的耦合较为复杂。为了应对潜在的复杂关联问题,该框架在架构设计上解耦了数据源、物理方程、神经网络之间的依赖,各个计算对象如微分方程和神经网络相关的计算节点可以进行单独定义。最后,基于给定数据源,自动获取需要的依赖结点;构建计算图,利用拓扑排序构造计算流水线;整合多个流水线,得到最终损失函数,进而利用反向传播结合梯度优化方法完成训练。考虑到PINN本身仍没有发展成熟,更多高效算法亟待开发。因此,该框架提供了回调机制支持用户自定义算法,使得PINN新方法也容易集成到框架中。IDRLnet包含了大量典型测试案例。首先,面向飞行器设计
310、参数优化问题,IDRLnet在不依赖外部数值仿真提供训练数据的条件下,能够实现物理场对设计变量的实时响应,大幅压缩“设计参数-数值仿真”迭代循环的周期。其次,对于含有异常传感数据的物理场重建问题,IDRLnet提供多种鲁棒优化方法可以对物理场参数进行反演识别。为进一步提升效率与精度,IDRLnet提供了自适应采样方法,动态改变各区域采样权重。同时,该框架还支持简单偏微分方程的变分形式求解。4.4.3 OpenMatrixMATLAB是美国MathWorks公司出品的商业矩阵计算软件,软件具有编程语言简洁易懂、计算功能强大、丰富的领域工具箱等优势,已成为快速实现算法验证和生成原型软件的有效编程工
311、具,广泛用于科学计算、可视化以及交互式程序设计等设计建模和数值分析领域。自2020年起,我国多家单2023 中国开源发展蓝皮书122位被列入美国政府的进出口管制名单,禁止使用MATLAB服务。为实现大型矩阵计算软件自主可控,解决大量基于MATLAB编程语言的软件原型遗产代码问题,同时缓解国产软件性能不足问题,迫切需要研发一款面向数值计算的高性能矩阵计算软件。国防科大龚春叶团队研发的OpenMatrix矩阵计算软件将对标商用MATLAB软件,旨在开发构建一款开源的适用于数值计算和科学工程计算的高级语言交互式环境,为计算流体力学、电磁学、气候气象等数值计算领域的设计建模与专业分析提供数值计算服务。
312、软件的定位一方面是解决禁运问题,满足遗产MATLAB代码快速适配需求,另一方面是利用高性能计算机实现并行优化,充分发挥计算性能。此外,OpenMatrix矩阵计算软件着重解决MATLAB并行计算能力弱、性能效率低等问题,针对重要领域开发并行求解工具箱,在不修改源程序的前提下实现性能跃升,利用并行算力优势弥补软件水平差距,弥补中美软件水平差距。当前OpenMatrix矩阵计算软件版本已具备提供高级语言解释器,实现了语言的前端解释功能,支持将MATLAB语言转换为中间代码,支持高级编程语言和交互式计算;支持面向高级语言的数据和通用函数兼容技术,提供统一编程接口,能够用简易编码方式支持各类问题的高效
313、试算,减轻使用者的编程负担和应用性能优化难度;已实现不包括第三方工具箱函数的大部分通用函数覆盖,包括:初等数学函数库、基本矩阵函数库、二维三维图形函数库、逻辑字符运算函数库、调试与控制流程函数库、时间与日期函数库和特殊数学函数库等,支持面向多种程序设计语言的统一外部编程接口,支持不依赖第三方库的MATLAB程序移植,支持遗产MATLAB代码的快速适配。OpenMatrix矩阵计算软件项目的下阶段规划是进一步开发和完善并行求解工具箱,突破关键领域算子并行优化,支持用户利用高性能计算机实现并行计算,使现有代码充分发挥底层高性能计算系统的算力资源,同时拟开发支持求解偏微分方程组的各种数值方法,包括有
314、限差分、有限体积和有限元方法,提供面向CFD计算的网格生成和自适应细化工具箱;最后充分开放共享,提供海纳百川的软件框架,着重解决标准化接口问题,使潜在的用户群体都能参与软件开发,丰富软件的工具箱和功能模块。OpenMatrix矩阵计算软件将迭代发展形成生态,支撑航空航天飞行器装备设计、环境仿真、密码分析、生物安全等传统数值计算领域应用,持续提供高效的数值计算服务。目前OpenMatrix矩阵计算软件已发布基于天河超算在线版,拟在三年内进一步拓展应用到1000家科研单位,拓展用户10000名。2023 中国开源发展蓝皮书123第五章 开源社区发展现状当前我们所身处的数字化时代几乎都是由开源代码所
315、构建的,伴随着开源运动在中国的落地与发展,中国的开源社区从最初单一且独立的社区不断演进,呈现出今天百花齐放的繁荣景象。本篇集中呈现当前国内各类社区发展的现状和特点。5.1 开源社区的起源与发展历程十几年前,很多人认为“开源=Linux”,因为当时的Linux操作系统、桌面办公软件(GNOME、OpenOffice)和浏览器(Mozilla)作为开源项目的主战场,掀起了第一波开源的浪潮。随着开源项目规模的不断壮大,开源社区也逐渐形成。国内的开源社区起初以Linux爱好者为主导,最早出现于1998年。不过,早期国内社区多为个人爱好者兴办,社区的发展规模和影响力有很大的局限性,因此中国第一代社区的持
316、续发展能力不足,大多销声匿迹。如,于1998年在清华大学成立的阿卡社区(AKA),2000年前后发展到顶峰,但此后受骨干成员出国、成家、创业等影响,逐渐进入低潮期,其中部分人员转型嵌入式培训,AKA转变为亚嵌公司。AKA早期的多数成员后来成为了中国最早的一批Linux精英。2001年创立的灰狐动力社区,最初只是一个关于中间件技术研究和应用纯个人网站,到2002年已经成为国内中间件行业极具权威性的站点。但在2010年5月19日,灰狐动力和开源力量宣布合并。创始于2006年12月的哲思社区,在当时是中国知名的自由软件社区,也已于多年前停更。而其中只有少数幸运的优秀社区因得到企业和产业的广泛认可而找
317、到生存模式获得新生,如CSDN逐渐成长为中国最大开发者社区,ChinaUnix社区被IT168公司收购,PHPChina社区被康盛创想公司收购(后期被腾讯整体收购),开源中国社区被恒拓开源公司收购等。后来,随着互联网的兴起,开源的项目和技术呈现百花齐放之盛况,从数据库到中间件、从前端到后端、从编程语言到编译器、从物联网到微服务、从大数据到人工智能,开源的技术和项目越来越丰富和多样化。在此趋势下,自2008年起,中国第二代开源社区纷纷登场。在吸取了一代的教训后,第二代社区的典型特征是更加聚焦、更加务实,通常是围绕一个公司的特定产品,且该公司作为社区的唯一或最大赞助商。这类社区包括深度操作系统社区
318、、Ubuntu麒麟社区、龙芯俱乐部、OpenEuler社区等。这些社区的发起团队普遍具有全球开源视野,同时也认识到知名科技企业在开源生态发展中2023 中国开源发展蓝皮书124的核心作用,与企业合作共赢是开源社区发展的关键路径,第二代社区开始有意识地吸纳开源布道者、市场专业人士和法律专业人士成为社区的骨干人员。近几年,随着移动互联网和云计算、AI在中国的蓬勃发展,中国开始涌现出大量开源项目的开发者,国内开源社区进入第三代。典型代表包括开放原子开源基金会、开源中国社区、木兰开源社区、GitCode、确实(Trustie)开源社区、OpenI启智开源社区等。第三代社区的典型特征是在社区运营和管理上
319、更加中立和平衡,且社区内包含不同来源的众多开源项目。目前中国第三代开源社区仍处于起步阶段,在开源治理、社区运营等方面尚显稚嫩。能够坚持中立立场、平衡诸多赞助商之间以及与开发者之间的关系,吸引开源治理专家、培养社区运营骨干是第三代社区当前面对的主要挑战。中国第一代技术社区至今仍坚持运营的屈指可数,最成功的典范就是CSDN开发者社区,作为目前世界第二大的开发者社区,20多年来CSDN为中国培养了几代开源开发者,同时也见证了中国开源快速发展的20年。2022年4月,CSDN成为开放原子开源基金会黄金捐赠人。也通过扩大对开发者服务内容(开源知识库、培训、猎头、代码托管平台、开源项目孵化和开源创投),身
320、体力行地推进开源产业的发展,正在积极地向第三代开源社区转型。由企业主导的第二代社区正在积极的与第三代社区(含国际开源社区和开源基金会)合作,通过开源捐赠或发起新项目等多种形式融入第三代社区,如华为将欧拉开源操作系统(openEuler,简称“欧拉”)捐赠给开放原子开源基金会,携程捐赠Apollo项目到Apollo开源社区,百度捐赠HugeGraph图数据库给Apache软件基金会,华为将开源的云原生多云容器编排项目Karmada捐赠给CNCF等。5.2 开源社区的现状特征据中国开源软件联盟不完全统计,截止2023年6月,国内各类开源社区已经超过500个,按照项目型社区、本地化社区、开发者社区和
321、代码托管社区四类进行汇总,项目型社区增速最为显著。从开发者规模和开发者合作参与层次上,部分开源社区已经发展到非常大的规模,在社区生态上取得了显著的成绩。5.2.1 项目型社区项目型社区是聚焦特定开源项目,包括代码贡献和协作、集成测试、应用实践、用户反馈等核心功能,大部分项目型社区由背后的机构或企业来资助或直接运营。具有代表性的项目型社区见后表。2023 中国开源发展蓝皮书125社区名领域项目地址项目社区介绍openEuler社区操作系统www.openeuler.orgopenEuler是由OpenAtom Foundation开发和运营的开源平台。其愿景是通过开放的社区形式与全球开发者共同构
322、建一个开放、多元和架构包容的软件生态体系,孵化支持多种处理器架构、覆盖数字设施全场景,推动企业数字基础设施软硬件、应用生态繁荣发展。OpenAnolis龙蜥社区操作系统OpenAnolis(龙蜥)社区成立于2020年9月,是一个操作系统开源社区及创新平台,由国内、外领先操作系统、芯片、云计算公司共同发起,致力于通过开放的社区合作,构建国内自主Linux开源发行版及开源创新技术,推动软、硬件及应用生态繁荣发展。OpenHarmony社区操作系统OpenHarmony是由开放原子开源基金会(OpenAtom Foundation)孵化及运营的开源项目,目标是面向全场景、全连接、全智能时代,基于开源
323、的方式,搭建一个智能终端设备操作系统的框架和平台,促进万物互联产业的繁荣发展。OpenCloudOS操作系统www.opencloudos.orgOpenCloudOS是一个完全开放中立的操作系统社区项目,由操作系统、云平台、软硬件厂商及个人发起。该项目旨在打造全面中立、开放、安全、稳定易用、高性能的Linux服务器操作系统,共同构建健康繁荣的国产操作系统生态。同时OpenCloudOS及衍生版本已在互联网、金融、政务等12大行业广泛应用,节点规模超1000万,经历了海量业务的长时间验证。我们秉承科技向善的使命价值观,是全球首个提出绿色操作系统的开源社区,用实际行动推动绿色数据中心节能减排,助
324、力全球碳中和举措。深度社区操作系统www.deepin.org深度社区是由统信软件全资子公司武汉深之度科技于2008年发起,已经持续运营15年,以桌面操作系统为主的开源社区,也是国内规模最大、历史最悠久、活跃度最高的开源操作系统社区之一,深受全球开源爱好者喜爱,具备相当的国际影响力。RT-thread社区操作系统www.rt-thread.orgRT-Thread是由上海睿赛德电子科技主导开发的开源实时操作系统,它也是集实时操作系统(RTOS)内核、中间件组件和开发者社区于一体的技术平台。Ubuntu Kylin社区操作系统优麒麟是由麒麟软件有限公司主导开发的全球开源项目。自创立以来已经有10
325、年的历史以及技术沉淀,并得到了国际社区的认可。现累计发行20个操作系统版本,全球下载量3800+万次,活跃爱好者和开发者20+万人,累计向开源社区贡献代码超400万行,其中被 Linux、GNOME、Unity、OpenStack、Ceph接收Patch超7400个。OceanBase社区数据库OceanBase社区版是一款开源分布式HTAP(Hybrid Transactional/Analytical Processing)数据库管理系统,具有原生分布式架构,支持金融级高可用、透明水平扩展、分布式事务、多租户和语法兼容等企业级特性。OceanBase内核通过大规模商用场景的考验,已服务众多
326、行业客户,现面向未来持续构建内核技术竞争力。TiDB社区数据库TiDB是PingCAP公司自主设计、研发的开源分布式关系型数据库,是一款同时支持在线事务处理与在线分析处理(Hybrid Transactional and Analytical Processing,HTAP)的融合型分布式数据库产品,具备水平扩容或者缩容、金融级高可用、实时HTAP、云原生的分布式数据库、兼容MySQL 5.7协议和MySQL生态等重要特性。MongoDB中文社区数据库MongoDB中文社区是围绕MongoDB生态建立的中文技术社区,获得MongoDB官方的认可和支持。社区关注MongoDB以及相关数据产品和工
327、具。来自MongoDB官方的工程师、阿里、腾讯等大型互联网公司及业界MongoDB专家、MongoDB书籍作者等组成社区核心成员。2023 中国开源发展蓝皮书126TDengine社区数据库TDengine是涛思数据开发的一款高性能、分布式、支持SQL的时序数据库,其核心代码包括集群功能全部开源,同时TDengine还带有内建的缓存、流式计算、数据订阅等系统功能,能大幅减少研发和运维的复杂度,可广泛应用于物联网、车联网、工业互联网、IT运维、金融等领域。Apache Kylin大数据kylin.apache.orgApache Kylin是一个开源的、分布式的分析型数据仓库,提供Hadoop/
328、Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,它能在亚秒内查询巨大的表。ClickHouse中文社区大数据ClickH社区为国内最专业最具影响力的ClickHouse开源技术社区,致力于ClickHouse的技术研究、推广和普及。Apache SkyWalking云原生skywalking.apache.orgSkyWalking是一款分布式系统的应用程序性能监控工具,专为微服务、云原生和基于容器(Kubernetes)的架构而设计。飞桨PaddlePaddle社区人工智能飞桨(PaddlePaddle)是百度开发的一款集深度学习核心框架、工具组件和服务平台为一体
329、的技术先进、功能完备的开源深度学习平台,已被中国企业广泛使用,深度契合企业应用需求,拥有活跃的开发者社区生态。华为MindSpore社区人工智能 用户型社区用户型社区主要是开源爱好者自发形成的小型社区,以知识分享、经验交流和传播开源文化为主要目标。具有代表性的用户型社区见下表。社区名社区地址社区介绍LinuxFanswww.linuxfans.orgLinuxFans社区成立于2002年,是一个专注于Linux及开源相关的技术社区及互助论坛,拥有社区发行版Magic Linux。GoCN社区gocn.vipGoCN是中国最专业和最具影响力的Go技术社区。Python中国社区 pychina.o
330、rgPyChina是一个由全球使用中文的Python程序员自发组成的技术社区,面向实习、应用、推广Python以及相关技术的爱好者,关注Python语言在中国的应用、推广和学习。由Zoom.Quiet(大妈)和Sting Chen在2014年发起。它的前身是CPyUG(China Python User Group,华蟒用户组),发源于啄木鸟社区。物联网自动化社区物联网与自动化一脉相承,物联网自动化社区从工业控制和自动化的角度解读物联网产业的发展,分享最新动态、技术和应用。Linux人社区Linux人社区建立于2006年,是红旗Linux最辉煌时期的产物。Linux人社区不仅具有网论坛特性,它
331、还拥有一个具有开发能力的社区团队。具有代表性的用户型社区2023 中国开源发展蓝皮书1275.2.3 开发者社区CSDN()CSDN(中国开发者网络)创立于1999年,是全球第二大开发者社区,现有注册用户4300万。秉承成就一亿技术人的使命,为IT技术人成长及科技企业发展,提供开发者生态的全方位服务。CSDN在社区基础上,通过知识云、人才云、开发云三大服务,赋能开发者、研发团队及科技企业在IT知识学习、人才招聘、研发效能与协同管理等方面的高速成长与发展。开源社()开源社成立于2014年,是由志愿贡献于开源事业的个人成员,依“贡献、共识、共治”原则所组成,始终维持厂商中立、公益、非营利的特点,是
332、最早以“开源治理、国际接轨、社区发展、项目孵化”为使命的开源社区联合体。开源社积极与支持开源的社区、企业以及政府相关单位紧密合作,以“立足中国、贡献全球”为愿景,旨在共创健康可持续发展的开源生态,推动中国开源社区成为全球开源体系的积极参与及贡献者。2017年,开源社转型为完全由个人成员组成,参照ASF等国际顶级开源基金会的治理模式运作。近九年来,链接了数万名开源人,集聚了上千名社区成员及志愿者、海内外数百位讲师,合作了数百家赞助、媒体、社区伙伴。木兰开源社区()“木兰开源社区”建立于2019年8月,是国家重点研发计划重点专项“云计算和大数据开源社区生态系统”的核心成果。旨在促进产学研用各方开源
333、领域的交流,推动国家科技创新成果开源,加强企业、科教研单位和行业用户之间的沟通,推动开源成果转化落地,同时为各类开源项目提供中立托管,保证开源项目的持续发展不受第三方影响,通过更加开放的方式来打造和完善开源社区生态。可信开源社区()可信开源社区共同体(TWOS)由众多开源项目和开源社区组成,目的是引导建立健康可信且可持续发展的开源项目和开源社区。可信开源社区共同体(TWOS)旨在搭建交流平台,提供全套的开源风险监测与生态监测服务。SegmentFault 思否()SegmentFault 思否()是中国领先的新一代技术问答社区,也是中国最大的黑客马拉松(Hackathon)组织者。我们为中文开发者提供一个纯粹、高质量的技术交流平台以及前沿的2023 中国开源发展蓝皮书128技术行业动态。目前已经覆盖和服务了超过 1000 万开发者和 IT 信息从业者,帮助开发者解决了数百万个技术问题。开