《开源社:2022中国开源年度报告(110页).pdf》由会员分享,可在线阅读,更多相关《开源社:2022中国开源年度报告(110页).pdf(110页珍藏版)》请在三个皮匠报告上搜索。
1、前2022?年终于过去了,我们也出了三年?COVID?疫情的艰难岁。新年的中国开源年度报告,再次如约呈现在各位朋友们的前,到了万事俱备,只差“前”的时候了。回看过去年撰写的报告前,阅读待发布的报告内容,整理这年来的事与个的路历程,关于“年报”,咱们可以聊些什么呢??在?2020?年的报告中,我写道:“也许多年以后,我们回看?2020?年,会将其称之为:世界剧变之始。”,在?2021?年的报告中,我也写了:“世界正在发巨变,我们所处的世界,正在速朝着某个未知的向前进。”。在?2022?年,我们能看到些什么变化呢?世界剧变的趋势不会毫征兆,我们能够看出些什么趋势呢?对于未知的向,我们可以做出哪些猜
2、测呢??关于“剧变”个可能需要引起注意的现象是:科技、软件、开源,正在推动世界发变化的同时,其也在被这个世界所改变。开源,正在进下个发展阶段。开源的个英雄主义的时代已近昏,企业、基会主导的开源正在成为现实。读者们可以在这年的年度报告中,看出端倪。农业社会的产,是等待(帮助)动植物。业社会的产,已经变得常的庞、精细、复杂,但是毕竟还是看得、摸得着的。到了数字世界,在?0?和?1?组成的络之中,产、创新、协作、共赢,都需要被重新定义。成本、利润、市场占有率也需要被重新计算。这还是最近?20?年出现的趋势。?到了?2022?年,我们看到了?ChatGPT?、看到了?AIGC,看到了在各种产环节中,A
3、I?的介与助。产,需要被再次重新定义了!?在这样的过程中,开源会发什么变化呢??关于“产”2022?年的另件事,就是因俄乌战争引发的全球范围内的各种连锁反应,即使在开源社区,也法避免。在最近与朋友讨论的过程中,我表达了种意:“我们需要了解真实的开源世界,才能理性地思考如何对真实的开源世界?”,“任何听就是的夸险,或者掩盗铃式的忽略险,都是不负责任的。”?作为位负责任的开源,我们需要尽了解、理解真实的开源世界,并且尽我们所能,推动开源世界向好的向,或者少阻它滑向更坏的向。带着这样的思考,让我们迎接新的年吧!?关于“责任”庄表伟?2023.01.22?.?开源商业事记1.1?中国开源商业领域投资降
4、温录CONTENTS2022?开源年度报告开源事记?篇01.03.03?1.2?纷纷设开源管理办公室,开源合规与安全受到泛重视.03?1.3?向全球:中国开源商业公司集体出海.06.?开源安全事记.072.1?开源安全攻击持续,络数据泄露已成为重问题.07?2.2?基础软件?CVE?漏洞频繁出现,影响范围波及范围.07?2.3?开源安全组织发布开源软件安全指南,多家联盟与企业发布漏洞赏计划.07?2.4?开源安全具与与开源安全项相继推出.08?2.5?2023?年络安全市场预测.08三.?开源技术事记.093.1?智能.103.2?操作系统.113.3?编程语.123.4?Web?3.133.
5、5?数据库.13?3.6?云计算.16?四.?开源法律事记.174.1?SFC?v.?Vizio,个以消费者份提起的?GPL?维权案件.17?4.2?GitHub?Copilot,使开源代码进?AI?训练引发版权争议.18?4.3?南京未来诉江苏云蜻蜓,GPL?抗辩获法院持国内案.18?4.4?中国信通院牵头成“可信开源合规计划”并发布开源合规指南(企业篇).18?4.5?中国电技术标准化研究院牵头完成兰开放作品许可协议和开源治理系列标准.19?五.?开源社区、态事记.205.1?政治处不在,开源也不能独善其.20?5.2?各国政府与开源的关系纷繁复杂.20?5.3?更多中国在开源社区中发挥影
6、响.21?5.4?开源报告与榜单纷纷出炉,喜忧参半.21?5.5?开源平台的发展,依然在探索中.22?5.6?开源个体存现状,个英雄主义的昏GitHub数据篇2.1?通指标.24.243.7?开源基会中国企业数据分析.353.7.1?中国企业主导在?CNCF?基会?Landscape?中项的?OpenRank?排榜.35?2022?开源年度报告数据篇23.?概述.24.?指标介绍.242.2?社区指标.252.3?项分析指标?.25三.?宏观洞察.263.1?GitHub?活跃趋势图.263.2?全球项?OpenRank?排名?Top10.283.3?中国项?OpenRank?排名?Top30
7、?.303.4?中国企业?OpenRank?排名?Top30.313.5?中国开发者?OpenRank?Top50.333.6?基会中中国项排?.343.7.2?中国企业发起并捐献到?Apache?基会的项?OpenRank?排榜.36?3.8?技术领域排名.373.8.1?云原.37?3.8.2?数据.37?3.8.3?数据库.37?3.8.4?操作系统.38?四.?项洞察.38?4.1?机器活动占.38?4.2?社区成.39?4.3?社区反馈.404.3.1?Issue?回应天数.40?.22?4.3.2?PR?回应天数.41?4.4?仓库作时间分布图.41?4.5?仓库审查.43?五.?
8、具介绍Gitee数据篇2.1?总体趋势.45.45.?概述.45.?主要内容与发现.452.2?总体语趋势.452.3?增速最快语.462.4?年度最受欢迎的开源项领域.462.5?年度最受欢迎的开源组织.472.6?各地区开源贡献例.472.7?Gitee?指数.482.7.1?Gitee?指数评估维度与算法.482.7.2?2022?年?Gitee?指数?Top?10.50总结.51.44?.?概述?.53?.?开源软件商业化步全球化探索阶段?.53?2.1?开源软件商业化步全球化探索阶段?.53?2.1.1?软件全球化是发展的趋势?.57?2.1.2?开源软件具有天然的全球化发展的趋势?
9、.58?2.1.3?开源软件公司的国际化扩张?.58?2.2?开源软件全球化有多的驱动元素?2.2.1?塑造更成熟的公司形象?.59?2.2.2?减少对单市场的依赖?.59?2.2.3?获取新的可持续的发展空间?.60?2022?开源年度报告商业化篇2.3?商业全球化的挑战与困难?2.3.1?调整产品来解决本化需求52.59.60?.60?2.3.2?海外市场运营对多难题.61?2.3.3?改变组织架构来适应全球化运作?.61?2.4.3?全球化销售(云)2.5?全球化与本化的选择?2.5.1?产品解决的需求是否是全球化需求?2.5.2?产品的技术特点能否撑全球化?三.?开源商业化的驱动要素?
10、.663.1?开源社区建设是商业化的基础壁垒3.1.1?明确开源社区对企业的重要意义3.1.2?构筑多元开放的社区态?.67?3.1.3?丰富社区内容建设?.683.1.4?活动促进传播和增.65?.69.65?.65?.64.66?3.2?构筑商业化开源产品竞争3.2.1?赛道和创新性共同决定产品市场空间?.70?3.2.2?商业化产品切中付费痛点?.71?3.2.3?快速迭代以保持竞争3.3?精益治理实现降本增效3.3.1?开源协议是开源治理的前提?3.3.2?社区治理是不断壮的社区态的基3.3.3?开源安全问题治理需要期关注?4.1?全球市场情况4.1.1?2022?年国际融市场不确定性
11、增加,早期投资热度不减?.75?4.1.2?商业开源软件资本市场快速增?.75?4.1.3?VC?投资聚焦开源软件市场?.774.2?中国开源软件商业化发展情况?4.2.1?国内开源项多元化,领域持续繁荣?.78?4.2.2?资本市场对开源项保持度关注?四.?开源项资本市场情况?.75?.79?.74?.71?.70?.72?.73?.75?.72?2.4?全球化商业化的实现路径?.62?2.4.1?全球化开源态运营?.63?2.4.2?全球化服务?.642.3.4?开源软件公司对运营全球化开源社区的挑战?.61?.66?.78?四.?受访者特征.85?4.1?基本特征.854.2?已作受访者
12、特征.86?4.2.1?已作受访者龄4.3?学受访者特征.885.2.4?选择开源产品的因素.905.2.5?使开源产品时的问题.91?4.2.3?已作受访者作类型.874.2.4?已作受访者所在企业开源管理程度.874.3.1?学受访者所属专业.884.3.2?学受访者实习/实践经历?.884.4?公开代码使情况.88五.?开源参与情况.895.1?开源社区中的分布?.895.2?开源使情况分析.895.2.1?产品开源在产品选择时的重要性.895.2.2?使开源软件的原因.895.2.3?检索开源产品的途径.905.2.6?与开源社区的沟通式.91?5.2.7?是否与社区有互动.925.2
13、.8?吸引为开源做贡献的因素.925.2.9?贡献意愿?.92?5.3?开源贡献情况调查.93?5.3.1?参与贡献时.93?5.3.2?贡献类型.93?5.3.3?每周贡献时.93?.86?4.2.2?已作受访者所属业.86?.?报告背景.?重要发现?.82.83三.?问卷结果概览.84?2022?开源年度报告问卷篇815.4?开源社区运维者调查.965.4.1?社区基本情况.96?5.4.2?社区协作情况.97六.?国内开源发展调研6.4?开源度量是否有价值.996.2?国内外开源发展差距.986.3?开源的最终的是否是商业化.996.5?客观评价开源项的指标.996.6?投资开源的意愿.
14、100七.?总结.100.98?6.1?国内开源发展势态.98?5.3.4?参与的开源项种类与平台.94?5.3.5?参与开源贡献的原因.94?5.3.6?开源协议了解程度.945.3.7?贡献开源的回报类型.95?5.3.8?开源贡献中编程语分布.95?2022?中国开源年度报告开源事记篇?01?022022?开源年度报告1?https:/ Neo4j?5.0?版本正式发布?162022?开源年度报告?开源事记篇CNCF?全年托管?20?个毕业项2022?年全年,CNCF?共托管了?20?个毕业项、35?个孵化项和?102?个沙箱项,这些项来?189?个国家的?17.8?万多名贡献者推动。3
15、.6?云计算?CNCF?正式接受?Istio?成为孵化项?今年九底,CNCF?基会宣布,已投票接受开源服务格?Istio?成为?CNCF?正式孵化项。Istio?作为全球最欢迎的服务格,已经有来全世界?70?多家公司的?8000?多名开源贡献者为?Istio?贡献代码。CNCF?正式接受?Volcano?成为孵化项今年4份,CNCF?基会宣布,由华为云捐献的业界个云原批量计算项?Volcano?正式晋级为?CNCF?孵化项。Volcano?2020年进CNCF以来,在智能、数据、基因测序等海量数据计算和分析场景得到快速应,并构建起完善的上下游态,前腾讯、爱奇艺、红书、蘑菇街、唯品会、鹏城实验室
16、、锐天投资等企业均已将?Volcano?应于产环境。CNCF?KubeEdge?云原边缘计算项发布多项关键突破KubeEdge?是?CNCF?个云原边缘计算项,CNCF?批集成?Fuzzing?项。?KubeEdge?于2022发布?KubeEdge?单集群10万边缘节点报告,云原边缘计算威胁模型及安全防护技术书,并于?KubeEdge?Summit?2022?正式开源分布式协同AI基准测试平台?Ianvs?。前项已完成?EdgeMesh?可架构,KubeEdge?on?openEuler?持,?KubeEdge?on?openHarmony?持。在下代云原边缘设备管理框架?DMI?也将给带来
17、更优质的体验。腾讯开源站式为服务解决案?Spring?Cloud?TencentSpring?Cloud?Tencent?实现了Spring?Cloud?标准微服务?SPI,开发者可以基于?Spring?Cloud?Tencent?快速开发?Spring?Cloud?云原分布式应,实现诸如服务注册与发现、配置中、服务路由、限流熔断以及元数据链路透传能等分布式微服务场景。字节跳动开源研数据集成引擎?BitSailBitSail?持?20?多种异构数据源间的数据同步,并提供离线、实时、全量、增量场景下的全域数据集成解决案。前,BitSail?服务于字节跳动内部乎所有业务线,包括抖、今头条等家熟能详
18、的应,同时也撑了引擎多个客的数据集成需求。?TDengine?开源三周年,发布?TDengine?3.0TDengine?3.0?正式发布,升级成为款云原时序数据库(Time?Series?Database),解决了困扰时序数据库发展的基数难题,持?10?亿个设备采集数据、100?个节点,持存储与计算分离。?172022?开源年度报告?开源事记篇华为开源业界个分布式云原开源套件?Kurator分布式云开源套件?Kurator?助企业业务跨云跨边、分布式化升级,标是标准化、统分布式云管理,整合?Karmada、KubeEdge、Volcano、Kubernetes、Istio、Prometheu
19、s?等业界主流开源技术栈,为提供多云、多集群统编排,统调度,统流量治理,边云协同,统监控运维等核能,助企业业务跨云跨边、分布式化升级。?四.?开源法律事记?4.1?SFC?v.?Vizio,个以消费者份提起的GPL维权案件软件由保护协会(Software?Freedom?Conservancy,简称SFC)在?2021?年?10?起诉电视机制造商?Vizio,认为后者在提供流媒体产品和服务(特别是其?SmartCast?系统)时没有遵守所采的GPL开源软件许可条款,要求其遵守相应的许可要求。Vizio?则请求法院驳回?SFC?的违约之诉,认为应该受美国联邦版权法的管辖,排除州合同法的适。但加州
20、中区联邦地区法院在?2022?年?5?驳回这请求,认为?GPL?不仅仅是版权许可,同时也是合同协议,SFC?有权提起这诉讼。这意味着SFC可以在州层继续推进违约之诉,且旦胜诉,Vizio?的?SmartCast?系统的所有软件都有权以?GPL?许可的合同受益的份进维权。?该案的特别之处在于?SFC?并以著作权的份提起诉讼,是以消费者的份主张?Vizio?没有遵守开源软件许可协议的要求,导致下游软件法获得许可所保障的权利,下游软件根据许可条款享有合理预期,即?Vizio?会向他们开放相关的源代码以供审阅、修改和分发。这是开源社区次出现的真正以消费者(下游软件)份提起的GPL维权案件。专家点评?本
21、案的特点在于原告份为消费者/,其中有关?GPL?合同性质的认定于在先判例中早已存在。近年来,国内也出现较多机消费者对某些公司未依照所采开源软件协议公开相关代码的质疑,但尚相关案例,国内亦缺少类似?SFC?这样的维权组织,“SFC?v.?Vizio”案或许可以带来定参考借鉴。?梁尧:4.2?GitHub?Copilot,使开源代码进AI训练引发版权争议?GitHub?Copilot?是由?OpenAI?Codex?提供持的款?AI?结对编程具,主要定位是提供代码补全与建议功能,是?Visual?Studio?Code?的个插件,可根据当前件的内容和当前光标位置动成代码。版权问题成为其临的主要挑战
22、之,们认为其利开源代码进AI训练并输出相关代码其实是在未遵循开源许可证的情况下对开源代码的使,例如没有标注相关代码的来源、作者、许可证等。?182022?开源年度报告?开源事记篇程序员兼律师?Matthew?Butterick?联合多位律师对?Copilot?提出了集体诉讼;软件由保护协会(Software?Freedom?Conservancy,简称SFC)号召停使GitHub来进抗议。GitHub?前?CEO?Nat?Friedman?则提到,“在公开数据上训练属于合理使的范畴。”但前全美也还缺少?AI?训练中“合理使”的相关判例。?此外,微软将?Copilot?输出描述为系列代码“建议”
23、,并强调不会对这些建议“主张任何权利”。同时,微软也不会对由此成的代码的正确性、安全性或延伸出的知识产权问题做任何保证。Nat?Friedman?曾声称,?Copilot?的输出结果归属于操作者,其性质与使编译器样。所以只要接纳了Copilot?的建议,那就需要承担相关责任。但并法在接纳?Copilot?的建议时,获取代码的来源、作者和许可证等,临侵权险。4.3?南京未来诉江苏云蜻蜓,GPL抗辩获法院持国内案2022年10,国内个被告根据?GPL?抗辩获法院持的判决效。原告南京未来新技术有限公司起诉被告江苏云蜻蜓信息科技有限公司、刘某某侵害计算机软件著作权,诉讼请求被告连带赔偿原告经济损失?2
24、000?万元。被告律师发现,原告的代码中含有使“GPL+例外”许可证的软件,经过代码分析,认为原告软件不符合许可证中例外要求,且没有公开源代码,构成GPL违约。?法院认为:主程序系涉案?GPL?开源代码的衍作品,受?GPL?协议的约束,且“例外声明”对其不适,原告违反了?GPL?协议要求提供相应的源代码的义务,构成违约,原告基于?GPL?协议获得的许可终。法院如果基于原告的该权利认定其他为构成计算机软件侵权,即会保护原告的不当为带来的利益,势必赋于其特殊法律地位和特别商事利益,不符合公平、诚信原则。对原告违反?GPL?协议的为给予侵权法上的保护,势必虚置?GPL?协议关于源代码持续开源的相关规
25、定,对于通过?GPL?协议让源代码持续开源传播产不利影响。针对原告涉案软件的主程序部分,对原告主张两被告构成著作权侵权的主张不予纳,对其要求两被告承担相应的侵权责任的诉讼请求不予持。预览程序不是涉案?GPL?开源代码的衍作品,未被?GPL?开源代码传染,故不受?GPL?协议的约束。原告主张该部分软件著作权的保护,以及被告是否侵害该部分软件著作权的判断,均不受?GPL?协议的影响。4.4?中国信通院牵头成“可信开源合规计划”并发布开源合规指南(企业篇)在?2022?年?5?20?召开的“OSCAR开源先锋”上,中国信通院牵头成“可信开源合规计划”,并发布开源合规指南(企业篇)。“可信开源合规计划
26、”为聚焦开源合规的国内开源组织,由中国信通院联合企业、科研机构、法律专家成,旨在凝聚各量,聚集批国内开源合规才,整合优质资源,完善开源合规标准体系,输出开源合规建设经验,全提升我国开源合规平,为业的发展提供强劲合。共有53?家批成员单位,包括正式成员?22?家,预备成员?31?家。?专家点评?软件企业使开源软件定要格外注意,尤其是搞清楚使了哪些开源软件,这些开源软件有哪些版权要求,研究清楚相关开源许可证的具体条款,并确保相关为合规合法。否则很容易陷违反版权要求不知的窘境。卫剑钒:?192022?开源年度报告?开源事记篇开源合规指南(企业篇)由中国信通院牵头,联合“可信开源合规计划”的成员单位的
27、专家共同编写完成,分析总结了开源合规发展特点,重点围绕开源软件与数据合规险、开源许可协议规定、企业开源合规险防控三环节展开研究,对于企业做好开源合规具有很强的指导意义,为推动我国开源合规建设提供了参考。4.5?中国电技术标准化研究院牵头完成兰开放作品许可协议和开源治理?系列标准?在?2022?年?12?29?召开的“2022?兰峰会”上,中国电技术标准化研究院牵头编制的兰开放作品许可协议正式发布。兰开放作品许可协议系列(Mulan?Open?Works?Licenses,Mulan?OWLs)是对开放作品的复制、使、修改和分发等为进规范和约束的具有法律效的格式合同,提供了授予专利许可的许可协议
28、类别,并对多版本作品提供了署名规范。?同时,与许可协议共同发布的兰开放作品中是兰许可证族应平台,为兰开源软件、数据和开放作品的登记、检索和使提供了撑。兰开放作品协议系列与应平台的发布为保护创作者权利、推动开放作品发展具有重要意义。专家点评?除上述开源合规指南(企业篇)外,国家知识产权局知识产权保护司在?2022?年?4?发布的企业知识产权保护指南中,也针对“使开源软件的知识产权险”、“产品开发涉及的开源软件是否可免费使”等开源相关主题撰写了专内容?。梁尧:同样,在?2022?年?12?29?召开的兰峰会上,中国电技术标准化研究院宣布其”开源治理系列标准“的制定作已经接近尾声,包括总体框架、企业
29、治理评估模型、项评估模型、社区治理与运营、开发者贡献度评价模型,这五向的系列标准经过多轮讨论与共识,将于?2023?年正式颁布,标志着我国在开源治理权威性、系统性、规范性的作的落地。?开源与标准协同发展研究报告由国内相关专家共同研究和编制完成,从国内外开源项、社区以及标准研究的实践及成效出发,以更科学的视系统分析并阐明开源与标准的关系,明确新发展趋势下开源的内涵与外延,为我国后续系统开展开源标准化作进步打开思路、给出向及建议。开源社的多名成员直接参与了中国电技术标准化研究院的开源治理系列标准的编写与制定作,既体现出开源社的智库越来越受到泛的认可,也体现出国内这种政府与社区合作新模式的探索,开源
30、的化正在重构传统世界的运转模式。?王伟:论是开源许可证还是还是开源标准,都是构建开源规则和开源法论的部分,通过严谨细致的研究作,为我国乃国际的开源发展贡献份量。兰开放作品许可协议是兰开源许可证族的新成员,最近也在与?OSI?积极接触和交流中,推进开放作品许可协议的国际化进程,开源治理标准需应到?OSPO?的实际治理过程中,与?OpenDigger?等开源具串起来、协同配套使,发挥出1+1于2的作。杨丽蕴:?202022?开源年度报告?开源事记篇多个著名的开源社区、开源项,在?GitHub?上、在的官上声援乌克兰,也有呼吁?GitHub?禁俄罗斯开发者的声出现,以于到了?3?2?,Github?
31、官就俄乌战争发表声明,承诺“将继续确保免费开源服务可供所有使,包括俄罗斯的开发员。”?然,封禁的事件依然在发,也有俄罗斯的开发者,甚前俄罗斯公司的雇员、来俄罗斯的开源贡献者被误伤,他们对于开源项的贡献痕迹,也遭到删除。还有不少企业级的“制裁”,开源企业或者暂停在俄罗斯的业务,或者宣布禁俄罗斯的代码贡献。?另,过激的为也不断出现,node-ipc?事件的爆发终于引起了所有开源的警惕,以开源发声进投毒,终于突破了所有正义的底线,直到?OSI?发布博谴责这为:开源抗议最终将会伤害开源。?总之,对剧烈动荡的国际政治局势,开源能够做什么,不能做什么,应该做什么,不该做什么?都是常困难的问题!5.2?各国
32、政府与开源的关系纷繁复杂?在?2021?年的开源事记中,我们观察到“各国开源政策将对开源世界的未来产重影响”,但是主要还是从国家政策对于开源产业的促进作来论的。到了?2022?年,我们观察到了更多、也更加复杂的现象。?美国主要关注的是开源安全问题,1?和?5?美国宫两次召集开源基会与?IT?巨头,共同商讨开源软件安全问题,并推出?1.5?亿美元开源软件保护计划,到了9份更通过两党法保护开源软件安全性。?在欧洲,更多的是关注来美国的开源竞争问题。9?14?,欧盟普通法院作出裁决,维持了之前对歌垄断为的达?41?亿欧元的创纪录罚款,罪名是?“将歌搜索?/?Chrome?与?Android?系统捆绑
33、在起”。?于亚洲,较“奇葩”的是印度针对?VLC?的封禁为。从?2?份开始,印度政府屏蔽了?VLC?播放器项的站及下载链接。到了?10?份,VLC?播放器开发商威胁起诉印度政府,于是到了?11?份,封禁解除。从开始封禁?VLC,再到前解禁,印度政府没有进任何表态,也没有向?VideoLAN?基会以及印度众提供封杀?VLC?的理由,确实令感到疑惑。?于中国,继?2021?年的四五规划之后,在?2022?年国家进步提出了知识产权强国建设纲要和四五规划实施年度推进计划、中国银保监会办公厅关于银业保险业数字化转型的指导意,到了?12?,三部联合发布的互联信息服务深度合成管理规定,也将对?AIGC?以及
34、开源领域产深远影响。?总之,政府针对开源业与开源态,可以施加多种多样的为,制定各种各样的政策,于后果,还有待期观察与总结?。五.?开源社区、态事记?5.1?政治处不在,开源也不能独善其?2022?年?2?24?,俄罗斯突然发动侵乌克兰的“特别军事动”,俄乌战争打响。随后在开源的世界,也发了多起重事件,看起来远离政治的开源,同样不能独善其。?212022?开源年度报告?开源事记篇5.3?更多中国在开源社区中发挥影响?2022?年,在国际基会还是传来了不少好消息的。3?,姜宁当选?Apache?基会董事、堵俊平再次当选?LF?AI&DATA?Board?主席;8?,Tina?Tsou?当选?LF?
35、Edge?Board?主席。其中尤为引瞩的是:Tina?是第位担任企业互联程任务组(IETF)作组主席的中国性,也是国际电联电信标准化部(ITU-T)历史上来亚洲最年轻的报告。她还曾担任?Akraino?技术指导委员会主席。根据?CSDN?的2022?中国开源贡献度报告,我们还可以看到更多数据:中国开源贡献者数量,占全球?9.5%中国开发者主导的开源项,占全球?12.5%全球公司开源贡献榜?TOP?50,中国占?20%?国际开源项?TOP?50,中国仅占两席从某种意义上来说:已经很好了,但是还不够好.5.4?开源报告与榜单纷纷出炉,喜忧参半?从?2015?年开始,开源社每年都会发布份中国开源年
36、度报告,到了?2022?年,我们终于看到了越来越多的同道中。7?,2022中国开源发展蓝书正式发布;8?,InfoQ中国开源发展研究分析?2022?发布;10?,CSDN2022?中国开源贡献度报告发布;11?,开放原开源基会、X-lab?开放实验室和阿巴巴联合出品的2022年开源数据热报告发布。?2020?年起,开源社和?SegmentFault?思否联合发起了中国开源先锋?33?之尖上的开源物年度评选,今已连续举办?3?年。在?2021?年,我们开源社和?SegmentFault?思否还次联合?OpenDigger?项,根据开源开发者在?GitHub?的协作影响评选出了来中国区?TOP?9
37、9?的开发者,并命名其为中国开源码。这本,就是个重的信号!?,我们可以看到更多的数据、更多的趋势与排榜,另,我们也能看出,越来越多的机构、企业和组织开始关注这些讯息。?不过,今年11发布的?GitHub?Octoverse?报告,也传来了些不太妙的消息:在今年新增的2050万中,印度、中国和巴西的增幅最,占分别为?32.4%、15.6%、11.6%,其中印度的开发者数增超过中国。当然,中国开发者增速看似放缓,这也可以解读为更多的中国开发者增,发在国内的开源平台上了。?专家点评?Github?数据中表明来港的开发者增加了?100?万以上,这当然是不可能的,只能猜这部分数据是陆开发者利港服务器访问
38、?Github,带上了港?IP。?蒋涛:印度开发者的增以及在开源社区中的活跃程度常值得关注。国际的?GSoC、国内的?OSPP?这类开源暑期夏令营活动,都能够看到印度学的影。未来中印两个国,定会成为常主要的开源开发者的来源,于世界的开源发展更有命。?王伟:?222022?开源年度报告?开源事记篇5.5?开源平台的发展,依然在探索中?互联时代,个越来越明显的趋势是:平台为王,即使是开源也不能例外。因此,平台的举动,往往也牵动所有的神。2021?年?5?到?2022?年?12?,GitHub?的在?18?个的时间内从?6500?万增?9400?万,在?2020?年,这个数字还只是?5000?万。与
39、此同时,国内的?Gitee?平台也在速增,2022年Gitee的代码仓库超过了?2500?万,数量超过了1000万,虽然总量上较之?GitHub?依然有差距,但是增速却毫不逊。?除了上这些好消息,平台的各项措施,却往往会遭遇批评。GitHub?Copilot?遭到质疑,SFC?甚在呼吁放弃?GitHub,时机已到!,到了?11?,项集体诉讼已提交到美国加州北区地法院,要求法院批准?90?亿美元(约?649?亿币)的法定损害赔偿。于后续将如何发展,咱们?2023?年再持续关注。?Gitee?推出的新政策“仓库开源必须审核再上线”,Microsoft?Store?推出的新政策“禁开源软件在平台上的
40、商业销售”,也遭到了泛的批评。?总之,平台政策牵发动全,经营者不可不慎啊!?5.6?开源个体存现状,个英雄主义的昏?在由开源软件的早期历史中,我们会遇到个个如雷贯的名字,这些代码英雄们开创了个崭新的时代。到了今天,传来的消息却常常令沮丧。著名开源作者删库跑路的新闻,时有发。或者被平台盘剥,或者遭公司嫖,或者遭受有毒论攻击被迫出,或者因为“申诉”宣布停开发并关闭所有项。还有很多默默闻,守护着重要开源项的们,因为仅仅是默默闻坚守阵地,所以也问津。?总之,个英雄主义的时代已近昏。那些孤独的个体们,正在渐渐下舞台,远离众的视线。我们开源世界,将向何呢??2022?中国开源年度报告数据篇?23?2420
41、22?开源年度报告数据篇GitHub数据篇?2.1?通指标:?GitHub?数据篇分为宏观洞察和项洞察两部分。宏观洞察篇对?2022?年?GitHub?全域志数据进探索(共12.6?亿条,相较2021年增了约?27?%)。同时,我们借助?OpenDigger?的指标及标注数据,从各个进分析。本篇章中,根据X-lab开放实验室提出的?OpenRank?指标对项进评估得到细分榜单,括全球范围内开源项排名、中国开源项排名、中国开发者排名、基会中中国企业排名、技术领域排名、以及项领域排名。项洞察篇借助?Apache?DevLake?具,对选定上榜项进更深的洞察,洞察内容包括项机器使情况、社区成、问题反
42、馈等指标,各社区的作时间分布,并从更底层给出项代码注释覆盖度、静态测试覆盖度、代码复度等指标。.?概述?.?指标介绍?OpenRankOpenRank?指标是由?X-lab?实验室研发的,基于开源开发者-项协作关系构建的协作络下的络指标。OpenRank?不仅能够很好的表征项的整体发展状态、社区参与度,且也引了开源态的要素,在开源态中出于协作关键位置的项也可以被很好的识别出来。详细指标定义:https:/ days5049,620,492,26592NixOS/nixpkgs23142.3153246.4228372644488890179533.21 days1954,328,217,184
43、43microsoft/vscode19611.9844532.9945.94 days12794,1710,1292,49014flutter/flutter18573.6137779.114.24 days8952,1269,371,19995MicrosoftDocs/azure-docs15303.2537582.76201226357822.61 days9802,99,142,2866dotnet/runtime14924.0829543.883349
44、50128.24 days4066,357,317,18157pytorch/pytorch13978.8530711.3693503435.58 days2209,565,481,21388odoo/odoo12855.2422252.924278029.59 days213,59,75,7499element-fi/elf-council-frontend10999.737910.62333.57 days97,20,246,4110godotengine/godot10695.7222406.4594
45、33097025.92 days4611,245,179,1685?292022?开源年度报告数据篇GitHub数据篇?排名第的是?home-assistant/core?项,该项是个基于?python?的家庭智能化平台,可运于本地服务器,或者树莓派上。利该平台,可以统控制家庭中所有的智能设备。随着物联向着更众化的向发展,量的开发者开始基于?home-assistant?构建的智能家居案,项的热度也在持续上涨,前每活跃参与开发者数量维持在?2000?以上。?专家点评?卫剑钒:home-assistant这个项很有意思,感觉让geek可以编程控制家的家电,不是由商提供这样的功能。?home-as
46、sistant?参与开发者数量趋势图(来源:Hypercrx)odoo/odoo?本年度?OpenRank?值达到12855.24,排名第,与往年相有较提升。odoo/odoo?是个开源的企业应快速开发平台,应范围覆盖了企业管理的各个环节。odoo?项热的背后,也代表低代码平台的迅速发展。?godotengine/godot?作为游戏开发引擎,在元宇宙概念的加持下,在?2022.8?发布?4.0?预览版后各项数据路上扬,并最终进?OpenRank?年度全球前,每的活跃参与开发者数量也维持在千左右,且热度还在持续增。?godot?参与开发者数量趋势图(来源:Hypercrx)王伟:Hypercr
47、x?这个浏览器插件具很有意思,可以直接在?GitHub?的任意个仓库上,深探索该开源项的各种数据指标与可视化的图。将个开源项社区中的各种活动,通过数据可视化的式表达出来,为我们开发者的常作增添了份乐趣。?杨娜:开源贡献来上新,另在于不断的查错修正。我们看到?MicrosoftDocs/azure-docs?开源档项名列?Top?10,超过?1.1?万参与数,1,226?新增贡献者。这个项开放参与者反馈档中的?bug,并给出修正建议。从活跃度看到,这年在云上开发、云原等向的热度不减。?302022?开源年度报告数据篇GitHub数据篇?3.3?中国项?OpenRank?排名Top30项名Open
48、Rank活跃度starfork参与数 新增贡献者巴系数issue解决周期issue响应周期1PaddlePaddle/Paddle5791.8116225.222344862201615425831.24 days1287,180,66,2642ant-design/ant-design4370.819926.88224625305.96 days1831,159,91,5443apache/shardingsphere2900.416378.5114116230.71 days1491,211,155,4874apache/pulsar2796.9
49、88351.97256742.1 days601,133,129,6375pingcap/tidb2538.8210846.573583707606855820.29 days1214,322,309,13846metersphere/metersphere2527.715097.0323786087241116418.55 days1790,345,248,4947PaddlePaddle/PaddleOCR2438.735938.893292459.58 days1262,310,280,5168apache/flink2412.778366.1
50、627438-9apache/tvm2169.456870.81387644.91 days240,42,45,32810open-mmlab/mmdetection2162.915191.32507524725.05 days963,138,90,28611apache/dolphinscheduler2115.846374.3414013218.12 days1188,198,181,75012taosdata/TDengine2069.335739.533358540833521408.34 days
51、560,100,68,25613apache/doris1996.137989.99316812.87 days612,241,200,69514alibaba/nacos1914.684379.47464827526.69 days871,212,115,15515apache/apisix1863.275008.55308674.63 days849,58,46,13416milvus-io/milvus1817.766319.835667605546415027.96 days1537,165,128,51317StarR
52、ocks/starrocks1759.9210128.4720775705311334335.54 days1043,390,359,140318apache/echarts1703.613924.74508719313.5 days554,115,71,63619PaddlePaddle/PaddleNLP1637.964475.924473675.11 days936,70,43,16320NervJS/taro1625.563839.3622035429.49 days479,99,100,36721ant-design/
53、pro-components1507.313795.97105105519.34 days580,151,107,57522baidu/amis1482.253284.3438306596256024223.63 days291,69,78,58023PaddlePaddle/PaddleDetection1403.643857.5834740061.65 days1020,133,51,19224pingcap/tiflow1355.934575.25520.76 days478,140,132,50425umijs/umi1
54、247.433490.027192114.67 days499,60,53,41526apache/iotdb1237.94779.8953417.99 days87,20,5,6727goharbor/harbor1209.183388.952794430.9 days265,152,181,31428taichi-dev/taichi1208.283386.224608457294473020.67 days395,85,64,29729tencentyun/qcloud-documents1196.663658.15528
55、9003861398624.5 days7,3,8,3530pingcap/docs-cn1188.255851.54626.26 days73,22,6,44?312022?开源年度报告数据篇GitHub数据篇?中国项中,排名前两名的项遥遥领先,后续项?OpenRank?值相近,说明中国开源项正在平稳发展。3.4?中国企业?OpenRank?排名?Top?30?项名OpenRank活跃度starfork参与数新增贡献者巴系数issue解决周期issue响应周期1Alibaba30615.297797.62 1823.16 da
56、ys9025,1839,1653,84342Baidu25020.3970774.972298420217745.67 days8273,1546,1134,44913Ant group21223.7160366.77470.1 days7124,1267,1225,59694Tencent11942.038270.246000271132821.46 days3842,815,863,43115PingCAP9939.9148527.892688611621.09 days3051,
57、764,748,34196Fit2Cloud5993.7913871.881219477319.65 days3670,587,349,9137QingCloud3254.6411759.72684315035.29 days872,185,158,8978Huawei3098.0310242.06686823455.07 days730,205,208,9949EMQ2929.8510278.225306522.49 days470,105,70,28210SphereEx2900.416378.1329
58、376230.71 days1491,211,155,48711StreamNative2796.988351.97256742.1 days601,133,129,63712JD2779.67271.97535264024.2 days714,189,193,76313ByteDance2720.889364..14 days820,175,170,85414Zilliz2615.3410833.076496627.37 days1797,209,173,826
59、15TAOS Data2487.597197.9336396509091331589.43 days632,106,72,28416StarRocks2122.8712752.25235134.14 days1196,418,398,169917API71863.275008.55308674.63 days849,58,46,13418Guojusoft1845.743589.6595128210.86 days1001,205,208,64319Vesoft1615.776256.21464045.06
60、 days354,85,99,59520Jina AI1543.347708.7413444319.2 days597,122,164,615Top30?榜单中,我们发现中国顶尖开源项在前端、数据库、云原、智能领域表现突出。其中?ant-design/ant-design?表现优异,项参与者,?ant-design?达到了最的?3882?,巴系数也达?到了?2530?,在?issue?解决时间以及活跃度也有不错的表现。?322022?开源年度报告数据篇GitHub数据篇?项名OpenRank活跃度starfork参与数新增贡献者巴系数issue解决周期issue响应周期2
61、1Oneflow1535.367646.6242922.04 days288,30,21,16422Taichi1488.294569.7859796794211244119.77 days427,98,67,33923Deepin1467.612033.777197537.31 days234,68,70,19024Youzan1242.912438.332368638.44 days366,103,71,19425Timecho1237.94779.8953417.99 days87,20,5,6726
62、VMWare1209.183388.952794430.9 days265,152,181,31427Alluxio1159.183686.78748273258582825.08 days119,37,43,21128Didi1139.52990.00811528615.26 days435,91,93,30729DCloud1084.682681.8444281721.06 days478,82,84,47430RT-Thread1057.662850.8687922.79 days120,27,11,
63、77在企业?OpenRank?排名,Alibaba?依旧保持第的排名。其各项指标均处于较好的准。Fit2cloud?凭借DataEase、MeterSphere、JumpServer在开源领域的知名度,本次排名第六,相往年有较提升。?专家点评?王伟:Fit2cloud?这家企业常有意思,默默地经营着个常活跃且有影响的项。中企业的资源有限,开源运营策略必然会和不样,充分借助?GitHub?这样的平台常奏效。个好的代码托管与开发平台,能够让好的项快速成,并被家泛知道,对于整个开源态来说,都是常有价值的。?332022?开源年度报告数据篇GitHub数据篇?3.5?中国开发者?OpenRank?To
64、p50?特别地,对上榜开发者GitHub个仓库中的项语类型进分析,JavaScript?是上榜开发者是最常的开发语。GitHubIDOpenRank1afc163917.02chenjiahan684.263uranusjr629.444Kenshin603.835antfu594.286terrymanu546.37sxzz539.938fisker516.469wu-sheng513.210spacewander478.461188250462.5512Goooler447.5313mysterywolf429.7914jiasli425.515chenshuai2144424.3216t
65、isonkun394.7417waruqi394.6418AlexV525377.7719jw-foss363.7320messense349.6321sangshuduo348.4122andyzhangx333.6223LinuxSuRen330.124njzjz329.6325JounQin326.48GitHubIDOpenRank26hsluoyz309.4227haizhilin2013291.2628pahud270.1729plainheart264.493059.7831utzcoz256.3532seisman253.2733littletomatod
66、onkey252.4334ruibaby252.3235NewByVector248.0236kezhenxu94246.1837ruanwenjun224.0638tao223.9339visiky223.3140winlinvip219.4941JohnNiang219.4742YunYouJun217.6343tiye215.6944jiangjiajun204.1745Brooooooklyn200.6246pissang199.0947yi-Xu-0100197.1748limingxinleo195.549felixonmars191.6750sy-recor
67、ds186.47?342022?开源年度报告数据篇GitHub数据篇?3.6?基会中中国项排?项名OpenRank活跃度starfork参与数新增贡献者巴系数issue解决周期issue响应周期1apache/shardingsphere2900.416378.5114116230.71 days1491,211,155,4872apache/pulsar2796.988351.97256742.1 days601,133,129,6373apache/flink2412.778366.0812388-4apache/tvm21
68、69.456870.81387644.91 days240,42,45,3285apache/dolphinscheduler2115.846374.3414013218.12 days1188,198,181,7506apache/doris1996.137989.99316812.87 days612,241,200,6957apache/apisix1863.275008.55308674.63 days849,58,46,1348milvus-io/milvus1817.766319.8356676
69、05546415027.96 days1537,165,128,5139apache/echarts1703.613924.74508719313.5 days554,115,71,63610apache/iotdb1237.94779.8953417.99 days87,20,5,6711goharbor/harbor1209.183388.952794430.9 days265,152,181,31412apache/dubbo1117.482930.82069318.24 days407,105,76
70、,19613apache/rocketmq987.963109.832585010.42 days569,115,84,21714tikv/tikv954.144871.322065326257473316.16 days295,66,81,27715karmada-io/karmada912.433299.0273021.9 days357,30,16,5316k3s-io/k3s900.542805.2329837.14 days433,69,124,22817apache/shenyu797.912291.75192074
71、0325856411.28 days378,53,35,10518apache/incubator-kyuubi725.782564.31713.43 days416,85,63,25519apache/ozone688.23355.553-20apache/skywalking672.841991.0827327754173712116.24 days331,20,26,159在捐献到?Apache?Software?Foundation?和?Linux?Foundation?的中国项中,Apache?项的整体数据表现亮眼,ShardingSphe
72、re、Pulsar、Flink、tvm?等项名列前茅,值得指出的是,Flink?在没有使?GitHub?Issue?功能的情况下影响第三,活跃程度可斑。?352022?开源年度报告数据篇GitHub数据篇?3.7?开源基会中国企业数据分析?注:中国捐献给开源基会的项按照发起企业聚合的结果3.7.1?中国企业主导在?CNCF?基会?Landscape?中项的?OpenRank?排榜项名OpenRank活跃度starfork参与数新增贡献者巴系数issue解决周期issue响应周期1Alibaba10117.3931053.9246849.0112923.01 days325
73、2,656,511,16202PingCAP3492.9615717.8856481033705132.07019.55 days1509,388,390,16613SphereEx2900.416378.51141.016230.71 days1491,211,155,4874StreamNative2796.988351.9725.06742.1 days601,133,129,6375TAOS Data2069.335739.53335854083352.01408.34 days560,100,68,2566API71863.275008.5
74、5308671679592.015014.63 days849,58,46,1347VMWare1209.183388.952794430105337.066944.9 days265,152,181,3148Alluxio1142.453637.4773726425457.02823.87 days118,37,40,1929Huawei1072.673581.547.06123.2 days302,64,77,37610EMQ1069.412798.9205841138420.06318.05 days196,53,35,7411QingCloud884.483423
75、.78.022046.37 days448,63,61,32512Ant group674.172372.391.03641.23 days136,34,42,18513Vesoft670.652125.01.02728.32 days217,52,67,31514JuiceData531.941710.58287530919937.02116.14 days268,59,34,12315Bytebase485.422620.3627742169932.0922.62 days45,9,3,3016ByteDance244.64
76、969.376.02426.81 days65,12,9,1817Fit2Cloud67.57190.3957693632119.77 days80,8,3,018OpenResty61.43221.0.07615.4 days23,6,4,1919Tencent13.5736.2238072171.0131.67 days4,2,3,4在?CNCF?Landscape?的?580?个开源项中,由阿巴巴发起的云原项群数据遥遥领先,全年参与开发者数量?5839?,新增贡献者数量?686?,超过了其他企业的总和。另外,涛思数据的项在活跃的同时,还保持了?
77、8.15?天的?Issue?解决周期,维持着项的速响应和健康发展。?362022?开源年度报告数据篇GitHub数据篇?3.7.2?中国企业发起并捐献到?Apache?基会的项?OpenRank?排榜项名OpenRank活跃度starfork参与数新增贡献者巴系数issue解决周期issue响应周期1Alibaba6052.5220899.0251645.040619.01 days1236,303,241,9602SphereEx2900.416378.51141.016230.71 days1491,211,155,4873StreamNativ
78、e2796.988351.9725.06742.1 days601,133,129,6374Baidu2100.885068.0767621888198091.0139219.72 days653,135,92,6835API71863.275008.55308671679592.015014.63 days849,58,46,1346Timecho1237.94779.895.03417.99 days87,20,5,677Huawei385.461247.4822312316327.02841.78 days108,16,18,698Kylige
79、nce74.59406.532161305323.013-9Oushu5.066.91431931-在中国企业发起并捐献到?Apache?基会的项中,阿巴巴凭借?Flink、Dubbo、RocketMQ?等顶级项同样占据榜。?372022?开源年度报告数据篇3.8?技术领域排名3.8.1?云原GitHub数据篇?借助对?GitHub?中主流项技术领域的标签数据,本次报告绘制了个热领域近年项发展情况,包括云原、数据、数据库、操作系统。K8s?疑是云原领域最热的项,虽然稳居第,但其在?2019?年后?OpenRank?值呈下降趋势。Grafana?是个开源的数据监控系统,近年来发展迅猛,成为了云原
80、领域排名第的项。3.8.2?数据数据领域的榜单中,Grafana、Kibana?两个项表现突出。?3.8.3?数据库排名第的?ClickHouse?是俄罗斯的?Yandex?于?2016?年开源的于在线分析处理查询?MPP?架构的列式存储数据库作为性能的OLAP数据库,其性能分优越,查询速度极快。优秀的性能也吸引了量贡献者的参与,ClickHouse?社区直处于良好发展状态。?382022?开源年度报告数据篇3.8.4?操作系统GitHub数据篇?SerenityOS?是个开源的操作系统,作者是来瑞典的程序员?Andreas?Kling?,在?2018?年完成了为期?3?个的毒瘾康复计划后,A
81、ndreas?发现?“有很多时间,没有什么可以做的?”,接着就了将近三年的时间全职创建?SerenityOS?。随着社区的壮和贡献者的增加,现在已经诞了属于?SerenityOS?的内存安全的编程语?jakt?,以及?跨平台?Web?浏览器?Ladybird。SerenityOS的标是不依赖任何第三库构建所有组件和具。近年来发展迅速,成为了操作系统榜单中第名。?注:?项与开发者标签请参考?OpenDigger?项标签数据,有额外标签数据欢迎?Issue?提交4.1?机器活动占?四.?项洞察在该部分中,选取了2022年?OpenRank?排名前100的项进分析。在排名前100的项中,动化机器创建
82、的PR占12%,评论Issue占达到36%,关闭PR占17%。动化机器在开源项中重要的。?机器活动TOP?100创建?PR0.12评论?Issue0.36关闭?PR0.17?392022?开源年度报告数据篇GitHub数据篇?4.2?社区成?在?2022?年中,3?到?8?每新增参与者均超过?4000?,其中?7?是新增参与者最多的个,Top100?项合计新增参与者数达到?4257?;2?、12?该指标不?3000?。在第次关闭?Issue?指标上,8?达到最值。?注:通常认为,由关闭的?issue?代表与社区进了次沟通。第次关闭?Issue?指标代表了新与社区进了第次沟通,该指标可以体现社区
83、成情况。?05000250030003500400045002022/1/12022/2/12022/3/12022/4/12022/5/12022/6/12022/7/12022/8/12022/9/12022/10/12022/11/12022/12/1社区成长指标分析新增参与者第一次关闭Issue率ant-design/ant-design?在新增参与者指标中表现分突出。?402022?开源年度报告数据篇GitHub数据篇?4.3?社区反馈?4.3.1?Issue回应天数排名项名Issue?回应天数1LCTT/TranslateProject0.732PaddleP
84、addle/PaddleSpeech1.473dataease/dataease1.694umijs/umi-next1.775PaddlePaddle/PaddleNLP1.796Tencent/tdesign-react1.967open-mmlab/mmpose2.038PaddlePaddle/PaddleClas2.619open-mmlab/mmdeploy2.6510alibaba/fastjson22.7711open-mmlab/mmocr2.8812PaddlePaddle/Paddle-Lite2.9313apache/shenyu3.1114apache/apisix3
85、.6715alibaba/lowcode-engine4.1416PaddlePaddle/PaddleDetection4.1817milvus-io/milvus4.1918Tencent/tdesign-vue4.4419apache/doris5.0320kubevela/kubevela5.07?412022?开源年度报告数据篇GitHub数据篇?4.3.2?PR回应天数特别地,emqx/emqx?项?2019?年以来的?Issue?相应时间逐年减少,从?23.05?天减少到?8?天,代表其社区对Issue?的反应速度逐年增快。同样地,PaddlePaddle/PaddleDetec
86、tion、apache/skywalking?在PR响应时间上逐步减少,分别从?2019?年的?6.37?天、3.42?天缩减到?2?天、0.95?天。排名项名PR?回应时间1alibaba/fastjson202jeecgboot/jeecg-boot03jeecgboot/JimuReport04dataease/dataease0.155LCTT/TranslateProject0.226metersphere/metersphere0.357bytebase/bytebase0.588apache/shardingsphere0.89matrixorigin/matrixone0.84
87、10apache/skywalking0.9511Tencent/tdesign-react1.2812Tencent/tdesign-vue-next1.4613PaddlePaddle/PaddleSpeech1.7314halo-dev/halo1.7715Tencent/tdesign-vue1.9216youzan/vant1.9817PaddlePaddle/PaddleDetection218juicedata/juicefs2.0119alibaba/lowcode-engine2.0220antvis/S22.044.4?仓库作时间分布图?仓库作时间展某仓库的志发时间分布,圆
88、形越代表在该时间段越活跃,以下是个仓库的作时间分布图:注:图中时区按标准时区计算,换算东区需要加时apache/echarts?在?echarts?项中,21?时处(北京时间凌晨5时)有协作为发,对仓库进探索后发现该时段协作为是由?Github?actions?引起的动化协作为。?422022?开源年度报告数据篇GitHub数据篇?PaddlePaddle/PaddleOCR在?PaddleOCR?项中,每周?6?时(北京时间周?14?时)的事件数量常集中,是?paddle-bot?每周次对不再活跃的?Issue?进动关闭的时间,PaddleOCR?社区的问答热度也可斑。apache/shar
89、dingsphereShardingSphere?项在周六?16?时(北京时间?24?时)有个常明显的异常点,本以为是常的?GitHub?动化任务导致的,实际是社区在尝试引?Issue?定时关闭时造成的。但由于动化为不符合社区预期,这个动化流程也很快被废弃了。kata-containers/kata-containers从作时间分布上虽然也可以看出?Kata?Container?是个亚洲主导的项,但整体分布相对其他项更加平均,可以看到其国际化平很,在欧美地区均有定的活跃。apache/pulsar可以看到?Pulsar?前主要以亚洲开发者主导为主,但在?13?时(北京时间?21?时)有定活跃,
90、应该是有部分欧洲开发者在持续参与社区的贡献。?432022?开源年度报告数据篇GitHub数据篇?4.5?仓库审查?该部分对个项的?git?件进审查,从研发效能的度进评价。?项地址档覆盖度静态测试覆盖度代码复度https:/ 2020Other software 2020SaaS 2025*Other software 2025*美国英国中国印度巴西图2.?全球?SaaS?市场在全软件市场占与预期(百万欧元)?Source:?Reply;?Statista?estimates;?teknowlogy?Group;?ID?1219255?552022?开源年度报告商业化篇1?https:/ in
91、 billion U.S.dollars电信/数据处理/信息服务IT/云服务/定制化开发服务软件服务/SaaSR&D 研发服务专家点评?说“软件全球化”,我脑海中第个冒出来的词是“全球软件化”,虽然不是个意思,但是都很有意思。卫剑钒:?582022?开源年度报告商业化篇2.1.2?开源软件具有天然的全球化发展的趋势暂时撇开商业化,开源软件从其本质上就具有着全球化的属性。开源项在接受和励贡献者的参与时不会对其背景和国籍进筛选。诚然,许多客观的因素(如语、化、时差等)会限制些项的参与者的组成,但这不影响开源社区欢迎、励和尊重所有贡献者的精神。?个好的开源项可以吸引全世界各地的开发者来添砖加。?根据
92、?GitHub?发布的数据显,个?GitHub?的开源项平均可以获得来?41?个不同国家和地区的贡献者的帮助。同时,Github?作为全球开源项的聚集地,其构成也在渐变得更加多元化。根据?2021?年的数据显,北美的例较之?2020?年继续下降2.3%31.5%,其他所有地区的活跃占则都在提。?这全球化属性在开源软件公司商业化出海的过程中是常宝贵的资源。这在后续的章节中也会具体提到。?图7.?全球?GitHub?发布?Source:?GitHub?2021?The?State?of?the?Octoverse?2.1.3?开源软件公司的国际化扩张?对于开源软件来说,国际化扩张也已经成为众多成功
93、的开源软件公司发展历程中重要的个环节,如在2021?年?3?,GitLab?就通过合资公司的模式成极狐并成功打中国市场,?RedHat?的合作伙伴态系统遍布全球,2020?年,Confluent?就通过从?Red?Hat?新加坡办公室招聘拥有多年亚洲软件市场经验的?Damien?Wong?来更好地服务其主要的亚洲客。Elastic?有来全球?125?个国家的客。?专家点评?任旭东:开源的全球化和软件的竞争边界化,态的边界性和软件的边际成本有关。?592022?开源年度报告商业化篇种种数据都可以体现,前市场上最成功的批开源软件公司,都将国际扩张作为很重要的战略向。这对于中国的开源软件公司也有着常
94、多的借鉴意义。?2.2开源软件全球化有多的驱动元素?根据对在商业化上成功全球化的软件公司的问卷调查显,驱动软件公司商业全球化的因素主要有以下个:?(Source:?Paddle?report,?问卷调查,国际扩张的主要驱动)?2.2.1?塑造更成熟的公司形象在众多的驱动因素中,受到最多软件公司管认可(42%)的因素是成功的商业全球化可以提升市场对于公司的认可,塑造个更加成熟的外部形象。成功的商业全球化是个很好的体现公司完善运营能和产品质量的式。通过成功的出海,公司证明了的产品可以满多元化的需求,同时的团队可以应对相对复杂的运营环境,这对于后续的全球化运作或本地的商业拓展可以起到很强的促进作。?
95、对于开源公司来说,这驱动因素的加持则更为明显。与闭源公司从创始期就具备商业化的属性不同,许多开源项初始并不把商业化作为核的考虑因素。这使得对于后续开启商业化进程的开源项来说,许多客可能会对其商业化能产质疑或犹豫。从调查的结果来看,成功的出海是可以快速提升客信的种模式。?2.2.2?减少对单市场的依赖排名第的驱动因素是减少对单市场的依赖(41%)。这点也很好理解,在个渐复杂的全球商业与政治环境中,多样化的收来源是降低险的主要段之。?在软件市场竞争越来越激烈的今天,完全依赖于本市场会导致市场内的任意波动都会给公司带来极的影响,甚影响个创业公司的存亡。这其中,当地政府政策的改动,新的技术的迭代,上下
96、游市场的变化都可能极的影响公司的商业表现。?专家点评?开源前多数针对TOB端,最重要的获客能就是信任状。多样化的海外客疑是中国企业最好的信任状之。李震宁:?602022?开源年度报告商业化篇通过全球化寻求收来源的多样化则可以很好地降低此类险,并为公司提供个缓冲来应对这些市场变化的个有效的段。对于中国的软件企业来说,在政策变化速度相对较快的环境下,拥有多渠道的收来源的意义也更加重。?2.2.3?获取新的可持续的发展空间根据参与调查的公司的数据显,成功的商业全球化可以平均为公司带来13%的直接的营收提升。除了短期直接的营收提升,成功打海外市场后也给公司带来了更发展和想象空间。这也是许多软件公司决策
97、者(40%)决定出海的重要考虑因素之。尤其对于本软件市场相对有限的国家来说,成功打更加阔的市场,如美国,对于公司本收的提升效果可能会更加显著。?对于中国的开源软件公司来说,海外市场更加成熟的市场规模,客更强的付费意愿和更的软件价格都是吸引开源软件公司积极探索软件出海/商业全球化的主要驱动。尤其是对开源软件来说,在拥有免费的开源版本的前提下,国内公司的付费意愿会明显低于欧美成熟市场中的客。同样的产品,国内与欧美市场的单价也常常会有个数量级的差别。所以成功打海外成熟市场给国产开源软件所带来的想象空间是巨的。?2.3?商业全球化的挑战与困难成功的商业全球化所带来的奖励疑是很多开源软件公司所向往的,然
98、出海的过程却需要临着系列的挑战与困难,这其中包括了对于产品需求的把控、海外市场的运营、组织架构的搭建等等。?(Source:?Paddle?report,?问卷调查,软件公司国际扩张的主要困难)?2.3.1调整产品来解决本化需求根据问卷调查的结果显,如何调整产品来解决海外市场本地化的需求是出海软件最主要的挑战。这其中不仅仅是技术层对于产品的挑战,更主要的是对个完全陌的环境去了解在那个环境客的需求。语、化、时差等系列的差异加了远程了解客需求的困难。?与产品功能本化相关的还有产品定价的本化。不同国家对于软件,尤其是开源软件的付费意愿有着常的差异。将原本的定价思路和体系照搬到国际市场往往是不通的。如
99、何准确地了解海外市场对于公司产品的需求,认可程度和付费意愿,并基于这些数据来找到最优化的定价策略是软件企业出海过程中必须解决的问题。?专家点评?开源项的引进和出海,都涉及到了量本地社群的建设,依托本地社群可以较有效地解决开源项的本地化问题。姜宁:?612022?开源年度报告商业化篇2.3.2?海外市场运营对多难题除了与产品相关的挑战,对于初次跨出本市场舒适圈的软件企业来说,海外市场的运营也临着多的挑战。?先,在公司开始全球化进程之前,如何进市场就是个不的挑战。这需要公司结合多的因素进综合的评估,其中包括了各个市场对公司产品的需求,对软件的付费意愿,本竞对的实等。选择合适进的市场对于公司后续发展
100、有着决定性的作。?其次,销售与市场营销的本化也是挑战。最直接也最常的式就是建当地的团队。然这样的本化策略的弊端也很明显,就是需要在前期就投量的资。在次向软件公司管的问卷调查中,37%的参与者将销售与市场营销所需要的投列为了阻碍公司全球扩张的最主要的因素。?最后,在全球化策略落地的过程中,本地团队的招聘也是个法避免的挑战。如何在个陌的环境中招聘到符合公司要求,契合公司化的才是需要公司决策层花费量精来设计和实施的。?对于中国的软件公司,在全球化的运营过程中往往还要遇到信任度和监管等各种各样的问题。解决这些问题需要从态度、组织化和产品设计多维度的共同努,并且需要以贯之的坚持。以?PingCAP?为例
101、,作为中国软件出海的先驱者,PingCAP?从成之初就坚持国际化道路,并成功将其明星产品?TiDB?数据库推出海外。?PingCAP的核团队就提出,解决信任问题是中国软件全球化运营中的道槛,尤其是像数据库这样的核基础软件。相较于欧洲与美国等西国家之间的软件互通,中国软件的全球化显然在这需要做更多的作来获取客的信任。?2.3.3?改变组织架构来适应全球化运作在个软件公司出海的过程中,调整组织架构来适应全球化的运作也是个必须的改变。这其中最主要的挑战来于?:在全球化的过程中仍然明确和坚持公司的专注的向,改变内部的组织架构来适应多国家多市场的运营模式,建和确保各个国家不同办公室之间企业化的致与传承。
102、?个公司的使命与愿景对于公司期稳定的发展是关重要的。在经历像全球化这样巨的变的过程中,如何根据不同市场的情况,充分迭代进化,在变化和专注中保持平衡,是公司层需要仔细考虑的。?家本公司和家全球化公司在其部的划分、激励机制的设置上会有很的不同。公司在出海初期需要设起效的组织架构,合理地授权和管理,才能在扩展初期快速发展。?才的多元化是资源也是挑战。对于个没有过多国际化作经验的团队来说,如何理解和尊重不同市场的化,协调各个国家办公室之间化、作习惯的不同,同时建统的公司化是个微妙的平衡,这也考验着软件公司除了产品能外的层的管理能。2.3.4?开源软件公司对运营全球化开源社区的挑战以上提到的这些挑战,不
103、仅是开源软件公司在全球化过程中会遇到,所有的软件公司都临着类似的困难。甚再退步,不仅是软件公司,乎所有的全球化公司都需要解决类似的问题。然,开源软件公司在这些困难之上,还需要解决另外个挑战?国际化开源社区的建设。?对于开源软件公司来说,开源社区是关重要并决定着开源软件成败的重要因素之。Confluent?的CMO?GC?Lionetti?就在次活动中表,Confluent?的企业发展在其成公司的?5?年前就已经通过发展社区开始了。他表社区对于开源软件公司来说是关重要的,特别是当你想在早期扩受众群体时。?专家点评我们也要看到当地法律规则对中国企业运营的些合规要求。近年些国家涸泽渔的为也定程度提醒
104、出去的企业要更加考虑当地法律合规运营的挑战。李震宁:?622022?开源年度报告商业化篇2.4?全球化商业化的实现路径个成功的开源项定有个活跃的开源社区。成功地经营个本的开源社区已经是个不的挑战,将这样活跃的社区在全球范围内扩张则更加困难。这其中,以下的困难是通常最困扰开源软件公司的:?语的差异:不同于闭源软件通常只是在作环境下需要对不同语间交流不通畅的问题,开源社区成员间的交流更加频繁。开源社区的成功也建在其成员活跃交流的前提之下。这其中包括清晰的说明档,开发者和使者在?issue?上的交流,代码的标注等。语的不同对于开源社区的影响也因此远于对闭源软件的影响。化的差异:不同国家之间的化差异也
105、会影响开源社区的运营带来挑战。在不久前的开源社?CosCon?的商业化圆桌会议上,JINA?AI?创始肖涵博提到亚洲区的开源社区成员对于社区回复时间的期望会欧美国家的成员要快些。所以在对不同国家的社区时,开源软件公司就需要调整社区运营模式来适应不同国家的化与习俗。当个开源项愈发的国际化,这其中不同化之间的交流也会越来越多。如何营造和确保个多元同时相互尊重理解的社区环境是对开源软件公司的个挑战。地理位置/时差:虽然现在家越来越习惯于远程办公与交流,但对于社区的打造与运营,适当的线下对的交流疑有着很的促进作。这点,对于刚刚开始全球化的开源软件公司来讲是很难兼顾的。时差势必会影响不同国家的社区成员之
106、间的交流和回复时间,这对于活跃交流的开源项来说也是个不的挑战。?虽然开源软件商业全球化临着种种困境,但是不乏量的开源软件公司成功的开拓了海外市场。举例来说,2021?年全年,Confluent?的营业收中有?36%?来全球?100?多个国家;另外家成功的开源软件公司?Elastic?在截?2022?年?4?30?时有来全球?125?个国家的客。并且得益于灵活的办公模式,其员更是散布在超过40?个国家。Elastic也在全球范围内与云商合作,布局超过?40?个地区来更好的服务全球的客。?两家公司也不约同的在年报中将国际扩展作为重要的战略标。(Source:Elastic?官,Elastic全球范
107、围内云商布局1)1?https:/www.elastic.co/cn/blog/whats-new-elastic-cloud-7-13-0专家点评?为什么时差并没有影响?Apache?合作的交流和回复时间?这个的核问题,还是我们对于开源沟通模式的兼容性不够。?632022?开源年度报告商业化篇2.4.1?全球化开源态运营对于前有意愿开展国际扩张的开源软件公司来说,实现商业全球化的主要路径包括以下点:对于开源软件来说,开源态的建设是其核的竞争,这其中包括了开源项本的建设,开源社区的完善,和开源基会的参与等。作为个期待国际扩张的软件公司来说,如何最化利和运营全球的开源态对其能否成功全球化起到了决
108、定性的作。在之前关于开源公司全球化所临的挑战中,我们提到了开源社区是关重要并决定着开源软件成败的重要因素之。所以,在实现开源软件全球化的过程中,先需要考虑的就是开源社区的运营。?针对之前提到的经营全球化开源社区的挑战,开源软件公司作为开源项的组织者也可以更多地做出有针对性的解决案。如在国际扩张前确保质量的档翻译,尤其是在?README?和些主要的件上,确保翻译后的内容清晰易懂,最限度的降低外国贡献者和使者的语槛;公司社区运营团队也需要主动去了解和适应各个国家开源社区不同的作习惯,积极开展基于当地的活动来增加成员的参与度与积极性,并减时差和距离带来的隔阂。?(1?搭建活跃度的全球化开源社区以?E
109、lastic?为例,直以来,Elastic?都将全球的开源社区放在了个极的战略地位。在?Elastic?的官上,你可以找到?12?种语的各类的分享会内容。在最近,公司也在全球各地开展系列的峰会来提产品的影响和社区的凝聚。这其中包括了?ElasticON?的峰会和?Elastic?Community?Conference。ElasticON?峰会作为向众的峰会,内容更加多元;?Elastic?Community?Conference?则专向开源社区的技术性论坛。但两个系列峰会都将全球化加到了峰会运营的每个细节中。除去向全球观众的线上峰会,ElasticON?在欧洲(阿姆斯特丹)、亚洲(本)、美洲
110、(华盛顿特区)都设了线下的峰会来增进对的交流。Community?Conference?则特别为全球各地的社区成员考虑,将会议设置为2天内的滚动播出,以某个特定时区的时间来安排会议章程。同时,分享会将使英语、法语、韩语、语、中、葡萄语等各国语。这样的安排突出了?Elastic?对全球社区的重视、尊重和包容。?(Source:Elastic官;各国语的络研讨会内容)(Source:Elastic官;各国语的络研讨会内容)(Source:Elastic官;Community?Conference的滚动播出模式)?642022?开源年度报告商业化篇(2?充分参与开源基会等国际开源组织积极参与国际开源
111、基会也是另外个拓展国际曝光度的很好的途径。对于许多寻求国际化的开源项,拥有国际知名基会的背书对后续的发展有着很好的推动作。在这,中国开源项在国际上的参与度也在快速提升。在国际上最知名的两开源基会?Apache?软件基会和?Linux?基会?中开始有越来越多的中国开源项加并从基会毕业。?2.4.2?全球化服务作为成熟的软件公司,产品的后续服务是必要且常重要的环。所以在商业全球化过程中,持服务的全球化部署也关系着公司的期发展。就像?Elastic?在其财报中指出,公司通过在?25?个国家部署持服务团队,从达到了全年?365?天?24?时多种语的全覆盖,确保其客可以获得及时的质量服务。对于处于全球化
112、初期的公司来说,从全球化初期就进这样范围的覆盖未必现实,但公司应该从项初期就拥有全球化服务部署的战略构思。在商业全球化进到适当的时间点时,主动部署本的商业化和服务团队。理想的团队应该具有全球化的视野和在当地的业务经验。在区域商业化逐渐成熟时,积极设本地的办公室,以及区域性的总部来真正达到快速扩张的的。如在?2018?年被?Salesforce?收购的?MuleSoft,早在?2013?年就通过分别在悉尼和布宜诺斯艾利斯设亚太和南美区域总部来打开国际市场,?这样的布局也帮助其进步开展本化的销售与服务。?2.4.3?全球化销售(云)?与全球化服务类似,开源软件公司尽早布局全球化销售也是商业全球化过
113、程中必要的部分。布局的模式可以是建本化团队,设本地/区域办公室,也可以是与当地企业达成合作关系。如前提到的?RedHat?的合作伙伴态系统就是其效完成全球化销售的重要途径之。Confluent?招纳?RedHat?新加坡办公室的Damien?Wong?也是为了更快更效的组建亚太区的本地销售和服务团队。?通过良好的经营这些开源社区与基会,开源软件公司可以获得的收益也常显著。除了获得更好的国际曝光度和知名度,开源软件公司还可以通过这些渠道更好地去了解本化的需求,获取?inbound?marketing,打开海外市场。相闭源软件,开源软件在这的优势明显。这也进步证明了开源态经营的重要性。?专家点评?
114、2022年有6个源中国的开源项加Apache软件基会孵化器,并且有6个源中国的孵化项顺利毕业成为Apache软件基会顶级项。姜宁:同时,依靠着活跃的开源社区,开源软件公司可以更直接与产品的常使者建联系,降低了获客成本。在全球化的过程中,这特点也将得到放。相较于闭源软件需要投量的时间和钱来进跨国销售,开源软件公司对国际开源社区的经营可以起到的作。公司可以通过社区接触到企业内部的开发者或者?IT?员,并以社区作为起始的市场营销,传播公司和产品的碑?。在全球软件销售领域,两个趋势对于开源软件的全球化销售有着极的帮助。?652022?开源年度报告商业化篇2.5?全球化与本化的选择?国际市场(尤其是欧美
115、企业)对于公有云的适应程度越来越,从降低了跨国销售槛。相较于传统的销售驱动模式(Sales-Led?Growth),国际成熟市场越来越适应和推崇产品驱动模式(Product-Led?Growth?PLG)。与闭源软件公司的传统商业模式不同,开源公司从本质上就带有了?PLG?的属性。在获客和付费转化的过程中,开源软件公司相于传统公司有着更的效率,更低的销售出。尤其是在陌的国际市场上,产品说话销售说话更加有效。?另外,对于中国的开源软件公司来说,其开源的属性也是个很好的解决上提到的客信任槛的段。PingCAP?的核团队就指出通过开源,中国软件公司可以更快更有效地获得开发者和使者的背书,降低客的怀疑
116、程度。同时可以在国外市场做告和宣传上节省很多精和开销。对于多数软件公司来说,全球化的市场有着不的吸引。国外更加阔的市场,更加的付费意愿,更加成熟的竞争环境都可以对企业下步的发展起到推动作。但在开源公司积极拓展海外市场之前,公司需要先解决个核的问题,那就是的公司适不适合全球化。这的考量主要来源于两:?2.5.1?产品解决的需求是否是全球化需求每个国家和每个市场都有着其独特的市场需求。尤其是在企业软件服务的领域,不同国家因为化、政策、监管、市场等各的差异会发展出常不同的需求。这当然有许多需求是共同的,如对于数据管理和分析。这样的需求也推动了系列开源软件公司成功的全球化,如?Elastic,Ping
117、Cap?等。?但也有许多需求是常本化的。如各个国家的税务政策就可能催出完全不样的客端的需求。在这样的环境下,许多产品就法满出海后的客的需求。这样的产品就更适合深耕本市场。?2.5.2?产品的技术特点能否撑全球化公司的技术特点是否具有全球竞争也是另外个需要考虑的因素。尤其是当公司希望打欧美等成熟市场时,开源软件公司需要正视的技术能在个更加成熟的市场是否具有优势。如果有,公司是否有信可以建造起护城河来保护公司的核竞争。个在本证明有市场和技术的团队,放到国际市场上很可能法保持类似的竞争。?对于公有云的适应提了软件产品标准化的程度。开源软件公司可以通过与公有云服务商达成战略合作来加速扩张。在公有云上的
118、部署也降低了远程销售的槛,为国际扩张初期的公司提供了量的便利。专家点评?对于?ToB?具或基础设施类软件,在产品形态允许闭源或开源的情况下,开源能够带来更好的?PLG?效果,因为社区能够作为更好运营产品的个新阵地,充分进代码和产品形态的展。在陌国际市场上,做好开源社区,核档,技术内容等,能对产品发现,迭代,增带来不可忽视的帮助。?边思康:?66三.?开源商业化的驱动要素?2022?开源年度报告商业化篇3.1?开源社区建设是商业化的基础壁垒?3.1.1?明确开源社区对企业的重要意义开源项的参与者范围,体系和内容复杂,从源代码开发到商业化成功的驱动要素是个值得探讨的问题。开源项创业者需要紧扣商业化
119、和市场需求,并充分挖掘开源带来的价值。本章节中,结合开源软件商业化的发展历程、全球和中国市场部分商业化成功的开源项案例,我们提炼出了前为发现的开源软件商业化的重要驱动要素,从开源社区、开源产品和贯穿项始终的精益治理三个因素展开。上述因素也是云启资本接触开源项时的关注点。但由于涉及因素众多,商业化成功的驱动要素不于本章节所述的内容,欢迎读者开放讨论和补充。开源社区建设是开源态构筑中的基础与核,社区建设从代码、产品、持企业的商业化标。?开源项的命在于泛地吸纳使者、开发者、个和企业进态,并通过使和回馈驱动社区繁荣,带动产品迭代的轮。因此开源并是拥有成熟产品后简单地开放源代码。即便在基础产品仍不完善的
120、情况下,社区态也能够带动其快速优化,使其更贴近真实和通的需求,实现从?0?到?1?的产品化落地;对于已经进商业化阶段的产品,开源能够集社区之,推进产品在实际场景中的快速迭代,催化从?1?到?10?的进程。我们关注到,多元开放的社区化、丰富的社区内容、具有传播性的社区活动能够在社区持续积极的发展中起到正向作。?代码是能够被简单复的,但社区态法被复制,真正为开源赋予活的是社区带来的产品迭代和增。?开源社区态专家点评?王:产品和社区双轮驱动、互相驱动,连接轴是社区治理,参与便利性是润滑剂,动来更好的解决痛点需求。?672022?开源年度报告商业化篇3.1.2?构筑多元开放的社区态开源社区的命来源于多
121、元开放的社区态。社区态中包含运营者、贡献者、使者等多样化的。运营者负责社区管理维护,贡献者参与提供内容,使代码和产品,有时参与讨论。其中,贡献者可以是企业员、学、校和研究机构员,以及出于商业的加的企业组织。开源贡献将不同背景同的思想嵌到产品中,减少参与产品研发的才和成本有限带来的障碍。?贡献者在底层代码基础上延伸不同场景,开发上层应,是产品完善和商业化场景搭建的内动。以openEuler?社区为例,基于?EulerOS?底座,出内核、云原、应、中间件等相关的?SIG?组,也充分吸纳外部企业参与功能模块和应的拓展。如奇安信深度参与?security?等?SIG?组,助推操作系统络安全能提升;SD
122、S?商星天合参与?Ceph?SIG?组的搭建和贡献,助?openEuler?发版本的?Ceph?集成和分布式存储场景适配;航天信加社区并在多个?SIG?参与贡献,推动?openEuler?操作系统与其“航天智云”系列产品适配,进智能航天场景。?企业贡献者还能够帮助开源软件适配上下游的硬件、云商等。腾讯牵头成的开源操作系统社区OpenCloudOS?即建在这样的供应链协同之上,批创始单位包括腾、芯、上海兆芯等芯商,数据中设备和软件提供商浪潮信息等产业态中的头部参与者。操作系统是连接上下游态的基础软件,企业的加使得软件能够更低成本地融产业链,加强上下游与社区软件产品的绑定。在算、存储资源多样化的当
123、下,开源社区能够突破开发者的业知识体系局限,低成本地助产品商业化实现。?使者也是社区的重要参与者。多元开放的社区态应该降低的槛,使更多地参与使、提问、交互。使者为开源项引流,是社区和产品影响建设的重要部分。例如?2022?年?8?开源的图像成模型Stable?Diffusion,截10,GitHub?Fork?次数达4.8k,衍出很多基于该模型的产品,前?Stable?Diffusion?各渠道累计活已超过1000万。?使者也可以成为潜在的贡献者,InfoQ?的调研表明,国内占最的开源社区参与式从克隆代码、评论Issue?转变为参加开源兴趣组、提交?PR,从开源消费者向开源产者转变。?多元开放
124、社区中的参与者?682022?开源年度报告商业化篇3.1.3?丰富社区内容建设社区内容包括档、视频、课程、电书等形式,内容产出促进参与者共享社区成果,参与共建。?档是开源社区的基础内容,有赖于社区内的众多开发者共同建设。档集成了历史的贡献内容,并使得其他参与者能够在此基础上使和开发。同时,社区的运营者也需要及时更新和维护档,使开源内容产的效性能够得到充分发挥。?相于开发者,使者开发能较弱,但使者的问题和有效的讨论也是开源内容的重要组成部分。开放的交互有助于收集反馈,了解需求。社区官应该在论坛中及时进的问题解答,构筑多参与讨论的态,讨论结果也可以服务于档的同步和更新,进推动产品的优化。?随着态的
125、丰富,对内容形式也产了多样化的需求。和熟练的开发者需要简单易的API,对新,社区也提供具有引导作的教程、新指南类内容。?多媒体形式的发展推动了内容建设的形式创新。以?PingCAP?的内容矩阵建设为例,除源代码解析系列博客和开源社区参与指南外,公司还发布了关于?TiDB?技术?的电书TiDB?in?Action,该书由社区成员参与编写,充分发挥了开源社区的协同共创优势。PingCAP?还开设了Paper?Reading?B站线上直播。对于潜在的,PingCAP提供?PingCAP?University?在线视频课程及认证,帮助企业和个熟悉分布式关系型数据库系统,同时了解?TiDB产品的全貌,在
126、海外也相应推出英版的?TiDB?Academy?课程。开源社区可利视频、直播、社交平台等拓展内容态,辅助社区影响建设和市场教育。?PingCAP?社区内容矩阵专家点评?内容建设结合搜索引擎优化,可以效地触达到垂直领域的,为项社群发展吸引和积累初始粉丝,且让参与内容建设可以进步建社群的归属感。姜宁:?692022?开源年度报告商业化篇3.1.4?活动促进传播和增丰富的社区活动类型社区活动完善影响建设,促进社区参与者的增。开源社区具有较强的社交性,很程度上依赖技术和社区的传播。活动体系包括线上竞赛、线下?meetup、型峰会等多种形式,活动中,开源社区也应当利好企业、布道者和?KOL?的作,开展对
127、开源技术和理念的宣传,使项深智,提升社区活跃度和粘性。?国内外的开源企业均提供了丰富的活动案例。Databricks?在其专注的AI、数据赛道举办了?Data+AI?竞赛、会议、讨论等活动,在应较多的融相关数据服务领域举办多次?Meetup?讨论活动和实践作坊。国产开源项也常重视活动的开展,如?PingCAP?的活动矩阵包括性能、难度项竞赛?Hackathon、捉“”竞赛,以及基础设施领域的分享活动?Infra?Meetup、年度?TiDB?技术会?DevCon?等。Zilliz?专注于结构化数据处理和分析,于2022年举办届结构化数据峰会,其常的?Arch?Meetup?活动也已持续上百期。
128、云启资本也积极举办开源相关活动,联合兰开源、华为?MindSpore、开源社等组织,以?BBQ?的形式邀请开源软件领域的从业员共同参与交流讨论。?线上活动覆盖更,成本相对更低,线下活动聚集专家和业参与者的交流和碰撞也同样具有重要意义。构建丰富的社区活动起到产品和社区推的作,另激发社区参与者针对特定的问题集思益,对产品的性能和实性提升带来帮助。?702022?开源年度报告商业化篇3.2?构筑商业化开源产品竞争3.2.1?赛道和创新性决定产品市场空间开源项要在初期获得认同,就要明确回答,该项能够于解决什么重要问题,以及基于技术沉淀,如何从赛道中脱颖出,即如何在解决问题的能和式上作出创新。创新性最能
129、够体现技术和时间壁垒。?开源项是时代的产物,服务于时代产的新需求。20世纪90年代,开始进信息化时代,?BeOS、Linux?等操作系统的开源在操作系统和整个开源态的历史上都具有重要意义。21世纪初,随着互联的普及和产数据量的增,数据时代开始,数据开源系统如?Hadoop?开始被量应,后续衍出了?Cloudera、Hortonworks?等基于?Hadoop?的商业化公司;此后数据灵活、效处理的需求越发凸显,基于消息中间件Kafka的?Confluent、基于计算引擎?Spark?的?Databricks?等也诞于态中。随着云的发展,Docker、Kubernetes?等开源项应运,开启了云原
130、时代。近年来,AI的快速发展催了开源平台?Hugging?Face、AIGC?模型Stable?Diffusion?等,在领域内受到泛关注。?需求和技术的迭代为开源带来了市场空间,相应的开源项和商业化公司往往也成为个时代的重要符号。成功商业化的开源项在领域发展早期抓住机遇,推动技术的新和应。相关领域的从业员当了解项并且其需求从中得到切实解决时,才会产使代码和贡献社区的意愿,为产品带来戶增。?时代演进中的重要开源项完整易的社区版产品脱胎于开源代码和社区,也应当服务于更泛的需求,让开发能较弱,但同样具有需求的、企业、组织产使意愿,Project-community?fit?到?Product-ma
131、rket?fit?是开源软件商业化的第步。?712022?开源年度报告商业化篇3.2.2?商业化产品切中付费痛点好的开源项实现商业化变现需要慎重考量付费场景。开源社区内容全,但距离商业化的核痛点仍有定的差距。对于企业客来说,可能需要更加快速易的软件和服务,需要管理者将社区参与者贡献的代码和补丁集成为商业化产品。付费产品的价值可以在于更完善地针对场景的功能、企业级的合规性和安全性、易的?SaaS?服务等,需要根据客画像和场景打磨产品。定位国内市场或全球化、不同业、不同规模客、公有云或私有云,都有不同的要求。为好的开源项赋予够的付费吸引,提升?Value-market?fit,才能打造适合商业化的
132、开源产品。?在去年的报告中曾探讨过开源商业模式,基于的付费痛点,开源项可以实现商业化的式包括持、托管、限制性许可、开放核、混合许可五种。企业需要抓住的付费意愿所在,提供对应的产品和服务。?对于开放核类产品,在保证社区开源版产品有够完整的功能模块基础上,需要针对付费的需求打磨付费版产品功能。例如?Gitlab?企业版针对在百以上的团队集成了?LDAP?协议、志审核等功能,为企业级定制访问权限控制、作流管理等的功能适配。Confluent?商业版向企业,提供了负载均衡、跨中数据备份、安全防护等级特性,在性能、安全等打造付费差异。对于托管型的商业模型,如Databricks、Acquia?等,Saa
133、S?服务更加轻量化,减少了企业私有化部署的早期量投,灵活可扩展,也顺应了的上云趋势,同时在闭源的云化版本中也提供级功能集成。?3.2.3?快速迭代以保持竞争软件开发企业需要保持敏捷性,对市场需求做出快速反应,并进产品迭代。传统闭源产品的命周期从导、成、成熟,到最后衰退,采者在后期会减少,产品逐渐被淘汰。但开源的增模式恰恰可以加速迭代,引产品迭代和增的良性循环,始终保持产品在市场上的命。?产品增曲线?722022?开源年度报告商业化篇开源社区天然在敏捷开发和快速迭代具有优势,开发者即是产品的使者,且数量众多,背景多元,可以在次开发需求产时即作出反应,缩短了企业等待接收市场充分反馈进更新的滞后性,
134、并利?UGC?的形式快速产出有针对性的解决案,融产品更新。以2022?年?8?才开源的图像成模型?Stable?Diffusion?为例,9份通过社区贡献获得了?M1?Mac?本地运版,10?份发两个就实现了?50%?的提速,并出现了融?Photoshop,Figma?等闭源软件的社区贡献的例?在场景复杂度不断提升的市场中,产品需要不断迭代才能跟上上下游软硬件的演进,服务于需求的开发敏捷性是开源项特有的壁垒。?3.3?精益治理实现降本增效3.3.1?开源协议是开源治理的前提开源协议规定了开源代码的访问和使规则。随着开源软件的发展,出现了多种类型的开源许可证,其中包括?Apache、BSD、MI
135、T?等宽松协议,允许使、修改、重新发布和衍作品的专有化,也包括?GPL、LGPL?等严格协议,与宽松协议的重要区别在于强调开源的传播性,要求衍品在同许可证下开源。?部分开源协议类型及规则?Source:InfoQ报告?近年出现的开源企业和云商的盾使得开源项的商业化公司主导了开源项的协议变更(包括MongoDB由?AGPLv3?变更为?SSPL,Elastic?由?APLv2?变更为?SSPL?与?Elastic?License?双协议),作为开源企业应对商业化空间被挤占,云商使开源但不回馈社区为的应对措施。另,从业整体趋势来看,宽松协议在开源软件领域中的占仍在逐年提升,2021?年占开源项的?
136、78%,更多项选择度由的开源态。?专家点评?这个是个很好的进步,宽松许可让更多的开发者和可以由的拥抱开源。另,严格许可协议也继续保持较使度。前全球应最多的前?10?类许可协议中,仍然有进半数协议是严格许可。李震宁:?732022?开源年度报告商业化篇3.3.2?社区治理是不断壮的社区态的基开源项的开源协议选择情况?Source:The?Complete?Guide?for?Open?Source?Licenses?2022?限制性的协议在适当的时候能够保护开源商的权益,但也会损失社区和开源项的使度和活跃性;宽松协议在定程度上提升社区的繁荣度,从充分发挥开源的优势和形成产品的壁垒。开源许可证的转
137、变会带来额外的成本,在?Elastic?与?AWS?达6年的纠纷中,在法律和开源态相关的舆论,都需要投更多资源。?不同类型的许可证为保护开源开发者的权益,维护健康的开源态设计。随着AI和深度学习的发展,AI具及其产的内容的伦理道德问题也受到关注,开源模型?StableDiffusion?采的?Creative?ML?OpenRAIL-M?协议即是为开源?AI?模型设计的许可证类型。该协议允许开放的访问、使和分发,但禁在违反相关法律和道德的情况下进滥,强调了负责任的使,减少对社会的危害,保障开源项的正常应。?因此,开源项在何种阶段选择何种开源协议,制定何种访问规则以规避潜在的险,是商业化要考虑的
138、问题。?在建了项和开源社区之后,社区治理常重要。运营者需要确定社区的组织架构、流程规范,并对社区的事务和内容进维护和管理。?Linux?基会和哈佛学创新科学实验室调研发现,很多泛使的开源软件是由少数贡献者开发和维护的,94%?的项由?10?名以下开发者负责?90%?以上的代码。还有量的项出现时间未更新的情况。?在开源社区不断壮,体系趋于复杂的过程中,治理显得更为重要。GitLab?在?2022?年就曾尝试为了缩减成本动删除免费账号中不活跃的项,但受到开发者的反对,最后只能将这些项转变为对所有可的对象存储库。另外,当开发者为社区做出定的贡献,却没有得到正向反馈时,也可能会出现停维护,甚“删库跑路
139、”等现象,造成贡献内容的损失,不利于开源态。因此,社区治理对于社区协作的良性发展常有必要。?社区中包含不同层级的、贡献者和管理者,运营者需要明确不同的参与者应当使的责任和权限,以及不同层级之间员如何流动。在协作过程中,社区还需要明确系列流程规范:代码的格、注释、提交流程的规范统能够便不同参与者之间的交互,审查测试、问题处理等流程保障社区稳定安全的内容产出。对于社区内容,运营者需要进常的管理和维护,对错误、没有遵循流程规范的事务和内容进处理,建动化的维护机制,对于有价值的内容,也需要及时整理,与社区制定的程碑和版本迭代计划进对照,做好版本管理。?742022?开源年度报告商业化篇3.3.3?开源
140、安全问题治理需要期关注社区治理要素良好的社区治理能够提升和开发者的参与体验,从持续贡献社区,让复杂的体系健康运转,使代码的更新迭代更加效。?由于源代码开放,开源软件的安全漏洞更容易被利,且由于使的软件众多,有些客甚不了解软件包中包含哪些开源组件,开源安全问题尤其凸显。2021?年包含安全漏洞和危安全漏洞的开源代码库分别为?81%?和49%,虽然相?2021?年有所下降,但从?2016?年以来的历史数据看,开源代码库的漏洞率直居不下。2021年底的?Log4j?漏洞事件波及范围覆盖全球近半的企业。?开源安全问题固然需要落地侧的动,但也会寻求供给侧提供的底层安全保障,开源项本对安全合规性的重视可以
141、很程度上避免重复劳动,提升市场信任度。?安全漏洞的发现可以依靠社区开发者的发动,也可以通过些活动和竞赛的组织来调动问题发现,运营侧也需要运动化的代码扫描等具,及时发现代码安全、开源许可证等出现的漏洞并进处理。更重要的是健全的安全治理体系,在漏洞测试、合规测试、问题修复等全过程中严格执操作。只有做好安全保障,开源软件才能够在商业化的道路上得更远。?开源代码库漏洞情况?图源:【synopsys】2022?OPEN?SOURCE?SECURITY?AND?RISK?ANALYSIS?REPORT?75四.?开源项资本市场情况2022?开源年度报告商业化篇4.1?全球市场情况4.1.1?2022?年国
142、际融市场不确定性增加,早期投资热度不减2022?年以来全球经济形势继续充满着不确定性,新冠肺炎疫情反复延宕,俄乌战争,欧美经济通胀等系列因素都导致了市场预期的幅度波动。北美科技企业的股价波动和幅度裁员也为软件市场的未来蒙上了层阴影。?然,在这样的环境之下,欧美资本市场对于科技公司的早期投资却并没有受到太的冲击。根据华尔街报和?PitchBook?数据的统计,2022年前三季度,Venture-capital?funds?共募资?1510?亿美元,超过了之前所有年度的全年融资额。即使是在经济下期普遍会临融资困难的次募资的?VC,也在2022年保持了不错的募资表现。从前三季度数据来看,新进市场的?
143、VC?的募资表现保持着?2021?年之前的平,甚有赶超之势。?这系列强势的募资表现,也带来了历史新的将近3000亿美元的弹药库。许多?LP,包括家族办公室、主权基等,都在熊市的环境下持续持?VC,因为他们认为AI等科技发展的趋势是期的,市场前的不确定则是短期的。历史数据也证明,VC?在经济衰退期可以其他资产带来更的收益。?当然,级市场和经济环境的萧条对科技?VC?的策略和表现也会有不的影响。VC?投资表,由于级市场的低迷表现,许多被投公司的上市前景不佳,为退出带来了不的挑战。?VC?投资预计些初创公司的估值可能在未来年内处于相对停滞的状态,且被投公司破产的例预计会之前上升约?10%。?4.1.
144、2?商业开源软件资本市场快速增商业开源软件公司的成在过去的?10+?年有共睹。开源公司逐渐找到期稳定的商业化路径,系列的外部因素(如公有云的发展,企业服务的付费意愿的提升等)也促进了商业开源软件产品的快速发展。?根据?OSS?Capital?的数据显,2013年时,年收达到1亿美元的开源软件公司屈指可数(10)。在过去的年间,达成这程碑式的收槛的开源软件公司超过了40个,有10+个公司成功完成?IPO,这其中不乏MongoDB、Elastic、GitLab、Confluent?等在级市场上备受追捧的公司。?开源软件公司的市值规模也从10年前的100亿美元左右暴涨到了超过5000亿美元,其中超过
145、4000亿美元的市值是在级市场上实现的。这些都只是在开源软件市场刚刚起步的阶段,OSS?Capital?以及许多VC投资都认为这个市场还具有巨的增潜。?专家点评?Developer-Led的开源云原商业化发展迅速,年收规模已达到490亿美元,并且以年化20+%的成速度在快速发展。蒋涛:?762022?开源年度报告商业化篇2020年1-2022年8:全球超?240?亿美?VC?基投到商业化开源软件公司?(百万美元)?Source:?OSS?Capital?轮次,开源软件公司分别在?B,C,D?轮收获了最多的资。具体各融资轮次的融资数量如下:?种轮:?159?A?轮:?138B?轮:?94?C?轮
146、:?38D?轮:?22?E?轮:?14?F?轮:?9?G?轮:?4?Pre-IPO:?142020年1-2022年8:商业化开源软件公司融资轮次分布(百万美元)?Source:?OSS?Capital?$724$2,578$4,377$3,685$3,988$1,784$1,994$1,565$3,24205000250030003500400045005000SeedABCDEFGGrowth$100$181$245$441$165$300$62$226$100$313$589$327$873$1,645$645$987$612$1,210$373$957$2,140$
147、1,570$929$1,245$427$1,368$1,368$1,350$1,224$806$514$02020年1月2020年2月2020年3月2020年4月2020年5月2020年6月2020年7月2020年8月2020年9月2020年10月2020年11月2020年12月2021年1月2021年2月2021年3月2021年4月2021年5月2021年6月2021年7月2021年8月2021年9月2021年10月2021年11月2021年12月2022年1月2022年2月2022年3月2022年4月2022年5月2022年6月2022年7月20
148、22年8月2020?年?1?到?2022?年?9?期间,360+?家开源软件公司在全球级市场上共计融资?500+?轮次,?融资额超过?240?亿美元。共有超过?230?家领投?VC?在参与到了开源软件公司的投资过程中。?在?2020?年?1?到?2022?年?9?的?32?个中,有?10?个的融资额超过了?10?亿美元。2021?年?2?、2021年?9?和?2021?年?9?更是超过了?15?亿美元。进?2022?年下半年,伴随着国际经济环境的持续恶化,VC?对于开源软件公司的投资也迎来了明显的放缓。但相较于级市场以及?VC?对于其他级市场的投资从去年?11?份起就明显放缓的趋势,开源软件公
149、司在资本市场上的活跃程度已经是相对坚挺。?772022?开源年度报告商业化篇在这超过?500?轮的融资过程中,超过?250?家初创企业获得了?1000?万美元以上的投资,其中有?5?家开源软件公司更是在过去短短?3?年不到的时间就获得了超过?5?亿元的投资。另外,有?71?家公司在过去?32?个中获得了?2轮以上的持续投资,19?家企业获得了超过?3?轮的投资,4?家企业获得了超过4轮的投资。2502002503001000+万美元2000+万美元5000+万美元1+亿美元2+亿美元3+亿美元5+亿美元公司数量740506070
150、80超过2轮超过3轮超过4轮公司数量2020年1-2022年8:商业化开源软件公司累计融资规模分布?&?商业化开源软件公司累计融资超过两轮分布?Source:?OSS?Capital?4.1.3?VC?投资聚焦开源软件市场开源软件市场的快速发展也吸引了量的?VC?投资机构开始深耕这领域。在过去的年间,专注投资开源软件公司的投资机构变得越来越多。?,上提到量的传统?VC?资开始涌这赛道。另外,从?2020?年左右开始,我们也看到了更加专注在开源软件公司的?VC。这其中的代表就是上提到的?2019?年成的?OSS?Capital(OSS?为Open-Source?Software?的简称,也就是开
151、源软件)。这是家只投资开源软件项的?VC。此外还有由?GitLab?Co-founder?兼CEO?Sid?Sijbrandij?在2020年创的?Open?Core?Ventures(OCV)。?与传统?VC?不同,OCV?会主动找到尚未商业化的有潜的开源项,招募创业者,并提供资和资源来孵化创业公司。?许多传统的?VC?公司也开始持续关注开源软件市场。除去?OSS?Capital?发布的针对开源软件市场的资本市场报告,Runa?Capital,?家聚焦?B2B?SaaS、Deep?Tech?和?Regulated?Industry?的?VC,也开始在?2020?年?10?起持续跟踪?GitH
152、ub?上各开源项的发展速度,并在每个季度发布报告(ROSS?Index)来公布期间发展最快的开源软件项,以及其融资概况。美国?VC?Accel?也在?2020?年?9?发布了?Open100?的列表,列出了?100?家各各业中值得关注的商业化开源软件公司。?(Source:Accel官)?VC?投资机构在最近天对这业的关注和热情也从另外佐证了开源软件市场的巨潜。?782022?开源年度报告商业化篇4.2?中国开源软件商业化发展情况?4.2.1国内开源项多元化,领域持续繁荣中国开发者和企业在全球开源社区中保持活跃,型科技企业和初创企业参与开源项孵化,涌现出很多在全球具有影响的项。?型科技企业依托
153、强的技术实和才基础构建开源态。底层操作系统上,科技企业布局操作系统国产化,形成?Anolis?OS?蜥操作系统开源社区(阿巴巴)、openEuler社区(开放原开源基会)等态圈。在云原、数据、AI、前端等领域也均有布局,如蚂蚁集团企业级?UI?设计具?ant-design,百度深度学习平台PaddlePaddle、数据可视化图表库?Echarts?等,均在?GitHub?社区有较影响和群体。?型科技企业越来越重视开源。开源产品已成为其云服务的重要组成部分,于完善产品矩阵。百度、华为、阿、腾讯、字节、蚂蚁等企业纷纷成开源办公室,利开源态赋能内部开发和态建设,提升综合影响,服务于国内融、电信、政府
154、、制造业等业的。?于开源核的初创企业也在不断涌现,在各领域均有开源商业化项出现,些项也在?GitHub?社区体现出了较强影响。在数据、数据库领域,初创企业围绕国内外市场产的规模、异构化数据,和益增的数据处理需求,进布局,如?PingCAP?开发的分布式关系型数据库?TiDB?和分布式键值数据库?TiKV,涛思数据开发的的时序数据库?TDengine,SphereEx?开发的的分布式数据库中间件?Shardingshere?等。智能化趋势下,AI?赛道出现创新性的“新物种”,如向?AI?应的向量数据库?Zilliz,可实现全类型内容搜索的神经搜索引擎?Jina.ai。开源的其他领域,如前端应、云
155、原、操作系统等,也均有初创玩家参与。这些初创公司依托明确的产品定位,深耕市场需求痛点,依靠创新性在深耕的领域内。国内型科技企业开源项及开源企业图谱(部分)2022?开源年度报告商业化篇4.2.2?资本市场对开源项保持度关注国内开源项融资情况?(GitHub数据统计截2022年121)近年来,中国开源项持续受到资本市场的关注,2020?年以来关注度明显提升,2021?年开源投融资总规模达?52?亿币,同增约?86%。?2022?年市场热度保持,其中不乏过亿的额投资事件。向量搜索引擎?Zilliz?完成?6000?万美元?B+?轮融资;DevOps?开源巨头?GitLab?落地中国成极狐科技,在?
156、2022?年连续进三轮共数亿币的融资;数字内容创作云平台提供商太极图形完成?5000?万美元?A?轮投资;轮科技基于百度开源项?Apache?Doris?内核开发了云原实时数仓?SelectDB,完成超?3?亿元天使轮和天使+轮融资;专注于容器云产品的谐云科技完成超亿元?B+?轮融资;多云管理软件及服务提供商致云完成1亿元?D+?轮融资。?前中国开源态发展仍处于较早期阶段,2022?年融资事件主要集中在?B?轮及以前,涉及数据软件、云计算与基础设施等领域,市场机会阔。?公司开源核公司业务最新轮?融资轮次最新轮?融资额最新轮?融资时间GitHub?StarGitHub?Fork流科技Apache
157、?APISIX微服务API关A+轮数百万美元2021/0610.8k2k鲸开源Apache?DolphinScheduler云原DataOps平台Pre-A轮数千万元2022/079.4k3.5k轮科技Apache?Doris云原实时数仓天使+轮3亿元2022/046.5k1.9k偶数科技Apache?HAWQHadoop?SQL分析引擎B+轮近2亿元2021/08672324天谋科技Apache?IoTDB时序数据库系统天使轮近亿元2022/062.8k750跬智信息技术Apache?Kylin数据联机分析处理引擎D轮7000万美元2021/043.4k1.5kStreamNativeApa
158、che?Pulsar分布式消息队列A轮2300万美元2021/1012k3.2kSphereExApache?ShardingSphere分布式数据库可插拔态Pre-A轮近千万美元2022/0117.7k6.1k潞晨科技Colossal-AI性能企业级AI解决案天使轮600万美元2022/096.8k637ChatoperaCskefu多渠道智能客服系统天使轮数百万元2018/082.2k742数变科技Databend云数仓天使轮数百万美元2021/084.8k500映云科技EMQXMQTT消息中间件B轮1.5亿元2020/1210.8k1.9kTensorChordEnvdMLOps种轮数百
159、万美元2022/111.3k102燧炻科技FydeOS基于Chromium的操作系统Pre-A轮数千万元2022/021.5k192泛化智能GAAS机主案-未披露2018/101.7k411GeekCodeGeekcode.cloud云开发环境种轮数百万币2022/04422GiteegitGit代码托管-6400万元2020/02-极狐GitLabDevOps具平台A+轮数千万元2022/09-?79?802022?开源年度报告商业化篇国内开源项融资情况?(GitHub数据统计截2022年121)公司开源核公司业务最新轮?融资轮次最新轮?融资额最新轮?融资时间GitHub?StarGitHu
160、b?Fork海科技IDPAI数据开发平台种轮数千万元2021/12173艾拉云科illa-builder低代码开发平台天使轮数百万美元2022/092.3k126极纳科技Jina多模态神经络搜索框架A轮3000万美元2021/1116.8k2kJuicedataJuiceFS分布式件系统天使轮数百万元2018/107.1k605致云JumpServer云计算及DevOpsD+轮1亿元2022/0419.5k4.8k才云科技Kubernetes容器云平台收购未披露2020/0794.1k34.5k泽拓科技Kunlun分布式数据库天使轮数千万元2021/0811215深之度科技LinuxDeepi
161、nLinux?操作系统B轮数千万元2015/0441370矩阵起源Matrixone数据智能天使+轮数千万美元2021/101.3k212Zillizmilvus向量搜索引擎B+轮6000万美元2022/0814.4k1.9k欧若数Nebula分布式图数据库Pre-A+轮近千万美元2020/118.3k926流科技oneflow深度学习框架A轮5000万元2021/024.1k478壁智能OpenBMB模型应种轮未披露2021/0835949易捷云OpenStackIaaSE轮未披露2021/074.6k1.6k原语科技PrimiHub隐私计算天使轮数千万元2022/0526360好科技Rai
162、nbond企业应云操作系统Pre-A轮数百万元2016/083.6k664睿赛德科技RT-Thread物联操作系统-未披露2020/017.6k4.2k巨杉数据库SequoiaDB分布式关系型数据库D轮数亿元2020/10305115边际科技Shifu物联软件开发框架A轮未披露2022/0620521纵横StarRocksMPP分析型数据库B轮未披露2022/013.6k793原科技StoneDB实时?HTAP?数据库天使轮数千万元2022/02639100太极图形Taichi数字内容创作基础设施A轮5000万美元2022/0221.7k2.1k钛铂数据Tapdata实时数据服务平台Pre-A
163、+轮数千万美元2021/0722352涛思数据TDengine时序空间数据引擎B轮4700万美元2021/0520.1k4.6kPingCAPTiDB分布式数据库E轮未披露2021/0732.9k5.3k数字天堂uni-appVue语法的统前端框架B+轮未披露2018/0937.4k3.4k乐维软件ZabbixIT运维管理A轮未披露2021/112.6k766KodeRoverZadig云原软件交付云Pre-A轮数千万元2021/081.8k636易软天创zentaopmsAgile项管理A轮数千万元2021/10946275云轴信息ZStackIaaS-未披露2021/031.2k38020
164、22?中国开源年度报告问卷篇?81?822022?开源年度报告问卷篇.?报告背景2016年初,开源社发布了2015?年中国开源社区参与调查报告,随后的年中,持续发布了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数据分析段和调查报告等多种形式,绘制份?2022?年中国开源世界的地图。这份问卷是每年中国开源年报的重要环,不基于调研的分析报告不过是纸上谈兵。问卷从两个度展开,其中包括个信息(包括作信息和开发者技术信息)和开源社区参与情况,与往年不同的是,今年我们加了开源社区度量和开源商业化相关的话题,欢迎家参与问卷并发表的想法。通过约30-55项问题的统计调查与分析,
165、我们希望能够还原出当前中国开源社区的真实现状,从为开源的后来提供权威的参考。?使者:使过某款或某款开源产品的?参与者:与开源社区有互动为的(例如参与开源社区组织的活动、参与社区会议等)?贡献者:对开源社区有实质性的贡献的(包括代码贡献和代码贡献)?维护者:主要负责对开源项进维护的(通常为项?maintainer、PMC?成员等)?四个层级的关系如图所:本问卷对受访者的开源参与情况进了详细的调查。在本问卷的受访者中,根据受访者的参与程度将开源参与者分为使者、参与者、贡献者、维护者。个形成洋葱模型,层层递进。对于四个层级的定义如下:?832022?开源年度报告问卷篇.?重要发现通过分析本次问卷数据
166、,综合对往年调查问卷结果和其他些公开发布的统计报告,我们得出以下条发现:?本次调研中,未使过开源产品的受访者?106?,占?27%;开源使者?286?,占?73%;开源参与者?250?,占?63%;开源贡献者?143?,占?36%;开源维护者?92?,占?23%。整体受访者分布呈字塔型,符合开源社区中真实分布例。本次调研中,已作受访者占?75%,学群体占?25%。相往年调查作受访者例提,也定程度说明已作群是参与开源的主军。开源贡献者中?86%?参与过代码类贡献,57%?参与过代码类贡献。可以看出开源项贡献中代码类是主流,代码类贡献也是分重要的部分。约?20%?受访开源开发者不了解?MIT?和?
167、GPL?协议区别,开源合规的普及仍需继续。关于“开源的最终的是否是商业化”这观点,赞同和反对的呼声持平;受访开源维护者中,75%所在社区有商业公司的持,商业化也是促进开源发展的重要因素。这些数据的背后,意味着开源在兼容并包的同时,也站在了字路上。90%?受访开源维护者所在社区使了?CI/CD?具,动化具越来越成为社区发展的好帮。绝多数受访者认为需要种综合的式度量开源项,不是仅通过单的指标,参与过开源实践的受访者认同例更。学受访者中,参与过歌开源之夏(GSoC)、开源供应链点亮计划(OSPP)等活动的受访者回答情况与开源开发者、开源维护者回答情况相似度。调查法?:以在线问卷式搜集样本和数据,交叉
168、对法分析数据推法?:线上社交媒体、博客、开源社问题数量?:55问题类型?:单选、多选、开放性样本量?:392完成率?:52.48%本问卷调查主要对使者、贡献者、维护者进调研,同时也对开源参与者进识别。本次调查问卷的基本信息如下:调查对象?:覆盖开发者、社区成员、贡献者、学、政府企业管理员调查内容?:主要涵盖个信息、作状况、开源社区以及开发者技术?842022?开源年度报告问卷篇三.?问卷结果概览本部分将调查问卷结果按照占进分组,读者可以阅读该部分快速了解问卷情况。90%最学历在本科及以上的受访者占超过90%。?90%?受访者在选择商业产品时会关注其是否开源。?90%?受访社区使了动化运维等具。
169、87%?受访者认同需要种法客观评价开源项,不是仅仅依靠star、fork等单指标这观点。?90%?受访者愿意投资开源。87%?开源使者与开源社区有互动,是开源社区的参与者。?86%?开源使者为开源社区做贡献,成为开源社区的贡献者。?93%?开源维护者所在社区举过社区活动。?70%76%?的受访者已经作。?77%?受访者从事计算机相关业。?73%?受访者使过开源产品。?74%?受访者认为国内开源发展越来越好。?72%?受访者从事技术相关作。?78%?的开源贡献者了解MIT开源协议与GPL开源协议的差异。?74%?受访开源维护者所在项有商业化打算。?75%?受访开源维护者所在项有商业公司的持。?7
170、0%?受访贡献者认为参与开源项的回报满理预期。?69%?已作受访者所在企业有开源软件使、管理规范。?68%?受访者有借助公开代码完成作的经历。?参与调查的男性受访者占?67%。?50%50%?已作受访者所在企业有购买商版本开源软件的经历。?52%?受访者认同开源的最终的是商业化。?53%?受访贡献者认为是社区的核贡献者。?46%?受访者维护者认为?Review?代码写代码更困难。?852022?开源年度报告问卷篇四.?受访者特征(共392受访)4.1?基本特征?本次问卷受访者主要集中在?21-50?岁年龄段,分布较平均。受教育程度普遍在本科及以上,其中男性占约为?67%,性为?33%,性别例相
171、去年更平衡。?所有受访者中,多数为科相关专业出,少部分也涉及管理学、媒体、英语等专业。受访者所在城市主要集中在北京、上海,这种分布规律与?COSCon?2022?北京、上海分会场参与数较多有关。?Q1:您的年龄是:Q2:您的性别是:Q3:您所受教育程度(包括在读):?862022?开源年度报告问卷篇4.2?已作受访者特征(共297)?4.2.1?已作受访者龄对于已经作的受访者,作年龄分布较均匀,作6-10年的受访者占最多,达到约30%的例。?4.2.2?已作受访者所属业受访者所属业主要是集中在互联和相关服务、软件和信息技术服务业,占超过70%。?Q7:您的作时是:Q8:您所从事的业领域本次调查
172、问卷中,有75%的受访者已经作,未作的受访者占25%。问卷分别对这两类的群进了更深的调查。?Q4:您是否已经作:?872022?开源年度报告问卷篇4.2.3?已作受访者作类型对受访者作类型进调查,有?72%?受访者从事技术类型作。?对于从事技术相关作的受访者,占最的五个职业份分别为:后端开发者、架构师、学术研究员、全栈开发者、前端开发者,前五占超过了?75%。?对于技术相关受访者,占最的职业份为运营,占达到了?22%?。4.2.4?已作受访者所在企业开源管理程度51%受访者所在企业购买使过商业版本的开源软件,70%受访者所在公司有开源软件、开源制品库使规范。Q12:您所在企业是否曾购买使商版本
173、的开源软件?Q13:您所在企业对开源软件、开源制品库的使是否有相应的使要求与管理规范??882022?开源年度报告问卷篇4.3?学受访者特征(共95)?4.3.1?学受访者所属专业所有学受访者中,62%?是计算机相关专业的学。4.3.2?学受访者实习/实践经历约?51%?受访者有实习经历,24%?受访者参与过歌开源之夏(GSoC)、开源供应链点亮计划(OSPP)等活动。4.4?公开代码使情况?所有受访者中,69%?受访者(268)有过借助公开代码完成作的经历。在接触过代码作的受访者中,该例达到?80%。?Q14:您是否是计算机相关专业的学Q15:如果您是学,您是否有过互联相关实习经历?Q16:
174、如果您是学,您是否参与过歌开源之夏(GSoC)、开源供应链点亮计划(OSPP)等活动?Q17:您是否有过借助公开代码完成作的经历??892022?开源年度报告问卷篇五.?开源参与情况(共286)5.1?开源社区中的分布?本次调研中,开源使者占?80%,开源贡献者占?50%,开源维护者占?32%。本章将围绕以上三个进分析。?5.2?开源使情况分析(共286)?5.2.1?产品开源在产品选择时的重要性Q20:在开源社区中,您认为您的是:(可多选)90%?的使者在挑选产品时会关注其是否开源。5.2.2?使开源软件的原因在使开源软件的各项原因中,“免费”是呼声最的原因占约?71%,其他各原因占接近。?
175、Q21:您选择产品时会关注其是否开源Q22:?您使开源软件的原因(可多选)?902022?开源年度报告问卷篇5.2.3?检索开源产品的途径5.2.4?选择开源产品的因素在开源产品的检索途径上,通过代码托管平台进检索是受访者检索开源项的主要途径,占达到85%;技术社区、技术媒体推荐占达到?60%,其他使者推荐占约?40%。?Q23:?您检索开源产品的途径(可多选)在挑选功能类似的的开源项时,“项介绍完整”成为受访者最关注的因素,占达到?72%,“开发者活跃”、“社区回复及时”等社区反馈因素占超过60%,“代码规范程度”、“开源许可证合适”等因素占约?50%。?Q24:哪些因素会影响您对同质开源产
176、品的选择(可多选)?912022?开源年度报告问卷篇5.2.5?使开源产品时的问题5.2.6?与开源社区的沟通式在使开源产品过程中,“项缺少档”是受访者所遇到的最普遍的问题,占达到?67%,其余依次为“项运出错”、“项依赖冲突”、“不稳定的版本更新”、“缺少相关功能”。?在受访者与开源社区的沟通式中,最受欢迎的是异步沟通具,占?78%,其次是国内通讯具,在国际化通讯具这选择数较少,但是在开源维护者中使较多,占?52%。?Q25:问题:在使开源产品时您是否遇到过以下问题:(最多选三项)Q26:您与开源社区的沟通式(可多选)?922022?开源年度报告问卷篇5.2.7?是否与社区有互动所有受访者中
177、,与社区有所互动的数占达到?87%,有?250?。?5.2.8?吸引为开源做贡献的因素Q27:您是否与社区有所互动(包括但不限于社区内发,参与可社区活动等)注:和社区有所互动代表着受访者已经成为参与者。对于所有受访者,“开源理念的认同感”是促进受访者做贡献的要因素,占?77%。“和谐的社区氛围感”、“拓展项功能的期待”、“对项领域感兴趣”等也是重要的因素。?5.2.9?贡献意愿86%?开源使者愿意未来参与到开源项中。Q28:您作为开源项的,哪些因素会促使您对项做贡献?(可多选)Q29:如果您尚未对开源社区做贡献,您未来是否有意愿参与到开源项中??932022?开源年度报告问卷篇5.3?开源贡献
178、情况调查(共143)5.3.1?参与贡献时5?成的受访者参与开源的时间在?1-3?年,3?成受访者参与开源时间在?3-7?年,2?成受访者参与开源时超过7年。5.3.2?贡献类型86%的开源参与者参与过代码类贡献,57%的贡献者参与过代码类贡献?。5.3.3?每周贡献时38%?的受访者每周在开源上的投时间不?5时;25%?的受访者投时间在?5-10?时;20%的受访者投时间在?10-20?时;17%?的参与者每周参与时间超过?20?时,可以认为是全职的开源开发者,该例相于去年的?13%?有所提。?Q30:您参与开源的时Q31:您对开源项的贡献类型是:(可多选)Q32-您每周参与开源项开发相关的
179、时约是?942022?开源年度报告问卷篇5.3.4?参与的开源项种类与平台受访的开源贡献者贡献的开源项多种多样,“完整的应层软件”例较少,占?32%;其他类别均超过40%。近九成贡献者在?GitHub?平台上做贡献,Gitee?平台贡献占相往年也有提,特别地,Gitlink?平台也被多位开发者提及。?5.3.5?参与开源贡献的原因“为了学习知识,提技术平”、“为了提升我认同感”、“为了获得专业发展机会或职业发展的便利”是受访开源贡献者做贡献的主要原因。5.3.6?开源协议了解程度78%?的开源贡献者了解?GPL?协议和?MIT?协议的区别,22%?开源贡献者并不清楚。Q34:您为哪些类型的开源
180、项做过贡献(可多选)Q38:您通过哪些平台对开源项做贡献?Q37:您是否了解?MIT协议与GPL协议的区别:Q35:您参与开源贡献的原因是:(最多选三项)56.64Q36:在开源项贡献中您最常的开发语是?(可多选)?952022?开源年度报告问卷篇5.3.7?贡献开源的回报类型“经验的积累”、“精神层的满”是受访开源贡献者获得的主要回报。回报量,7成受访者认为回报满预期。?5.3.8?开源贡献中编程语分布Python?是受访开源贡献者中最常的语,占?46%。Java、Golang、C、C+、Javascript、SQL?的选择率均超过?10%。?Q39:您是否认为参与开源项获得了回报(可多选)
181、Q40:您认为参与开源项的回报50%30%40%20%10%?962022?开源年度报告问卷篇5.4?开源社区运维者调查?40%?以上受访开源维护者所在社区规模达到500以上。?5.4.1?社区基本情况?94%?受访开源维护者所在社区举过社区活动。?82%?受访开源维护者所在社区有专职运营。?73%?受访开源维护者所在项有商业化打算。?Q41:您所在社区活跃有多少?Q43:您所在的社区是否举过或考虑举线上/线下相关的活动?Q44您所在社区是否有专职负责社区的运营?Q45:您所负责的项是否有商业化的打算?972022?开源年度报告问卷篇75%?受访开源维护者所在项有商业公司持。?5.4.2?社区
182、协作情况?约?46%?的受访者认为?review?代码是相写代码是件困难的事情,?44%?受访者的受访者不认同该观点。?90%?的受访者所在社区采了?CI/CD?具。?Q48:您所在项是否有商业公司的持?Q46:是否觉得review代码相写代码来说是件令头疼的事情Q47:社区中是否采了动化流程或CI/CD具??982022?开源年度报告问卷篇六.?国内开源发展调研(共392)6.1?国内开源发展势态?该部分内容主要关注开源整体发展的问题,所有受访者均参与该部分的调研。74%?的受访者认为国内发展越来越好,18%?受访者认为变化不,少数受访者认为没有以前好。?6.2?国内外开源发展差距?六成受访
183、者认为差距逐渐缩,两成受访者认为差距巨,两成受访者认为差距不。?通过交叉分析可以发现,开源使者中认为差距巨的占仅有?20%,开源贡献者中认为差距正在缩的占仅有?55%,开源维护者中认为差距不的占较低,仅有?11%。?Q49:您感觉国内开源发展态势?Q50:您认为国内开源发展相国外:贡献者使者维护者?992022?开源年度报告问卷篇6.3?开源的最终的是否是商业化?约?52%?的受访者认同开源的最终的是商业化,?48%?的受访者并不认同。交叉分析中可以看出,项维护者中不认同例增。在参与过开源实践的学中该例达到?74%?。6.4?开源度量是否有价值87%?的受访者认同“需要种式综合客观评价开源项,
184、不是靠?star、fork?等单指标”这观点,13%?的受访者不认同。该例在有开源参与经历的受访者中偏,开源维护者中认同例最,达到?93.5%,于其他。6.5?客观评价开源项的指标“项以及社区的活跃程度、“项稳定程度”、项是否具有影响、是否受众欢迎是受访者认为最能评价开源项的三个指标,选择率分别为?78%、74%、62%?。?D51:您是否认同开源的最终的就是商业化这观点Q5B:您是否认同?“需要种法综合客观地评价开源项不是仅仅依赖star、fork等单指标这观点?使者贡献者维护者使者贡献者维护者Q55:如果您是投资,您愿意将资源投放到开源领域吗??1002022?开源年度报告问卷篇6.6?投
185、资开源的意愿?约九成受访者愿意为开源投资,该例在开源贡献者、开源维护者中达到约95%。七.?总结本次问卷仅呈现了开源世界的隅,但微知著,展现了开源态的蓬勃发展。通过本次问卷调查我们发现,从开源产品的使者到维护者,都对开源有了更加深刻的理解。越来越多的开源爱好者由于对开源理念的认同,选择加开源。开源社区渐活跃,开源正呈现着欣欣向荣的发展势头。希望这份报告能够抛砖引,吸引更多的开发者和社区加开源。Q54:以下各指标中,您觉得在您中哪些指标于评价开源项(最多选三项)使者贡献者维护者感谢协作开源社区/单位参与志愿者?召集:王伟?开源事记:庄表伟、江波、向新勇、梁尧、袁滚滚、李明康、蔡芳芳?数据篇?:赵宇、张晨晖、张翔宇、李泽、夏婧?商业化篇:云启资本?问卷设计:张翔宇、李圳、温瑞、王婕、周禹任、陈元燊、?杨敏?整体报告汇总?/编辑?:张翔宇、刘天栋、丁昊?设计/排版:何景辉、于欣悦、朱庆裕.Corrie、冯歆怡、王梦特别感谢开源社顾问委员会的点评和参与:?(按姓字顺序列名)宦成?边思康?郭雪?姜宁?蒋涛?李震宁?梁尧?任旭东?王伟?王?卫剑钒?杨丽蕴?杨娜