【中国开源年度报告】由开源社从 2015 年发起,是国内首个结合多个开源社区、高校、媒体、风投、企业与个人,以纯志愿、非营利的理念和开源社区协作的模式,携手共创完成的开源研究报告。后来由于一些因素暂停,在 2018 年重启了这个项目一直至今,每一年参与协作的伙伴社区/单位和志愿者以及点评的开源大咖越来越多,还有更多的忠实读者表示每年年初都期盼能看到中立、客观、多元而优质的【中国开源年度报告】。我们希望今年呈现给所有关心、热爱开源的读者们更优质的内容,也欢迎大家给予这份报告建议、意见和反馈,让我们能精益求精,“兔”飞猛进。
今年的内容相当地丰富,为了帮助大家提纲挈领,我们整理了一个思维导图,希望对读者有帮助:
2022 中国开源年度报告思维导图
https://docs.qq.com/mind/DZWVOUmlvRlp1SnlI
【2022 中国开源年度报告】项目组
Part 1 前言部分
2022 年终于过去了,我们也走出了三年 COVID 疫情的艰难岁月。新一年的《中国开源年度报告》,再一次如约呈现在各位朋友们的面前,又到了万事俱备,只差“前言”的时候了。回看过去几年撰写的报告前言,阅读待发布的报告内容,整理这一年来的大事与个人的心路历程,关于“年报”,咱们可以聊些什么呢?
关于”剧变“
在2020年的报告中,我写到:“也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。”,在2021年的报告中,我也写了:“世界正在发生巨变,我们所处的世界,正在高速朝着某个未知的方向前进。”。在2022年,我们能看到些什么变化呢?世界剧变的趋势不会毫无征兆,我们能够看出些什么趋势呢?对于未知的方向,我们可以做出哪些猜测呢?
一个可能需要引起注意的现象是:科技、软件、开源,正在推动世界发生变化的同时,其自身也在被这个世界所改变。开源,正在进入下一个发展阶段。开源的个人英雄主义的时代已近黄昏,大企业、基金会主导的开源正在成为现实。读者们可以在这几年的《年度报告》中,看出端倪。
关于”生产“
农业社会的生产,无非是等待(帮助)动植物生长。工业社会的生产,已经变得非常的庞大、精细、复杂,但是毕竟还是看得见、摸得着的。到了数字世界,在0和1组成的网络之中,生产、创新、协作、共赢,都需要被重新定义。成本、利润、市场占有率也需要被重新计算。——这还是最近20年出现的趋势。
到了2022年,我们看到了ChatGPT、看到了AIGC,看到了在各种生产环节中,AI的介入与助力。生产,需要被再次重新定义了!
在这样的过程中,开源又会发生什么变化呢?
关于”责任“
2022年的另一件大事,就是因俄乌战争引发的全球范围内的各种连锁反应,即使在开源社区,也无法避免。在最近与朋友讨论的过程中,我表达了一种意见:“我们需要了解真实的开源世界,才能理性的思考如何面对真实的开源世界?”,“任何听风就是雨的夸大风险,或者掩耳盗铃式的忽略风险,都是不负责任的。”
作为一位负责任的开源人,我们需要尽力了解、理解真实的开源世界,并且尽我们所能,推动开源世界走向好的方向,或者至少阻止它滑向更坏的方向。带着这样的思考,让我们迎接新的一年吧!
庄表伟,开源社理事暨执行长
2023 年 1 月
Part 2 报告整体概览
2022年中国开源年度报告主要由四部分组成,分别是大事记篇、数据篇、商业化篇和问卷篇。
1 大事记篇
2022年的开源大事记,我们搜集整理了接近300条开源相关的新闻报道,也遇到了不少挑战:
首先是分类:那么多事件,应该如何分类,有些事情似乎既算是社区事件,⼜算是商业事件,⽽且还跟开源安全相关,那怎么办?
其次是取舍:怎么才算是⼤事件呢?每年那么多开源相关的投资,多⼤的投资才值得关注呢?引发⼤量议论?到底是对全球的影响重要,还是应该更加关注对中国的影响呢?
最后是总结:当我们尝试着以历史的眼光来看这些当下正在发⽣的故事,有哪些是值得关注的趋势,⼜有哪些可能只是⼀时热闹呢?
报告中的大事记部分的内容,就是我们将⼀年大事,分为“开源商业、开源安全、开源技术、开源法律、开源社区&⽣态”五个部分,尝试作出的年度总结。
2 数据篇
本次报告数据篇由X-lab开放实验室、Apache Devlake社区和Gitee联合制作,分为GitHub篇和Gitee篇呈现。
GitHub 数据篇分为宏观洞察和项⽬洞察两部分。宏观洞察篇通过对2022年GitHub 全域⽇志数据进⾏探索。同时,我们借助OpenDigger的指标及标注数据,从各个⽅⾯进⾏分析。本篇章中,根据X-lab开放实验室提出的 OpenRank 指标对项⽬进⾏评估得到细分榜单,括全球范围内开源项⽬排名、中国开源项⽬排名、中国开发者排名、基⾦会中中国企业排名、技术领域排名、以及项⽬领域排名。项⽬洞察篇借助 Apache DevLake ⼯具,对选定上榜项⽬进⾏更深⼊的洞察,洞察内容包括项⽬机器⼈使⽤情况、社区成⻓、问题反馈等指标,各社区的⼯作时间分布,并从更底层给出项⽬代码注释覆盖度、静态测试覆盖度、代码复⽤度等指标。
Gitee篇则对托管在 Gitee 的开源项⽬进⾏了统计分析,梳理和解读编程语⾔、功能分布的变化趋势,分析开发者在Gitee参与开源的情况,以期为观察国内开源的演进提供⼀个“本⼟平台”视⻆。
3 商业化篇
在去年的开源年度报告商业化篇中,介绍了开源软件商业化成功的底层驱动因素、开源软件公司的可能的商业化路径、开源项⽬投资⼈判断标准以及案例分享。整体回溯了从 1998 年开源(Open Source)⼀词诞⽣以来,直到去年的开源项⽬商业化发展情况,引起了许多开源伙伴的热烈讨论。
今年的商业化篇会在此基础上,更着重于与读者们⼀起探讨在当下市场环境下的⼀些趋势与变⾰。不难发现,随着国内的开源项⽬的积累与茁壮发展,已经有不少项⽬开始具备全球影响⼒与全球化视野。在这样的时代背景下,开源项⽬的商业化发展中,如何更好地把握全球机遇、应对共同挑战、推进开源软件全球化市场成为了值得研究与讨论的话题。
与此同时,今年的商业化篇在去年的基础之上,结合当下整体经济下⾏的趋势,再度深挖开源商业化的驱动要素并且分析这⼀年中的资本市场对开源项⽬的情绪⾛势,帮助开源项⽬与资本市场构建信息互通的桥梁。
4 问卷篇
从2016年开源社发布《2015年中国开源社区参与调查报告》开始,每年都开展对开发者的调查。今年我们再次启程,结合数据分析⼿段和调查报告等多种形式,绘制⼀份2022年中国开源世界的地图。问卷篇从两个⻆度展开,其中包括个⼈信息(包括⼯作信息和开发者技术信息)和开源社区参与情况。今年的问卷相比往年有较大的升级,我们从开源社区中所处角色的视角进行调查,并加入了开源社区度量、开源商业化相关话题。我们希望能够还原出当前中国开源社区的真实现状,从⽽为开源的后来⼈提供权威的参考。
以下是调查问卷部分结果:
Part 3
《2022中国开源年度报告》的编制,受到了众多开源界朋友、开源社志愿者和开源社顾问委员会成员们的大力支持,再此向所有参与报告制作的人员表示诚挚的感谢!感谢你们为中国开源贡献出自己的一份力量。