《OSCHINA & Gitee:2023中国开源开发者报告(86页).pdf》由会员分享,可在线阅读,更多相关《OSCHINA & Gitee:2023中国开源开发者报告(86页).pdf(86页珍藏版)》请在三个皮匠报告上搜索。
1、11/*使用电脑阅读,获得最佳体验11序毫无疑问,开源开发者圈子来看,2023?年是大模型?LLM年、生成式?AI?GenAI?年。一、这自然要从?OpenAI?说起,前一年年底,ChatGPT?的横空出世,标志着对话式?LLM?开始进入公众视野,为人们提供了全新的人机交互方式。而?2023?年?3?月,同系GPT-4.0?的发布则将?LLM?的规模和能力提升到一个新的台阶,为?LLM?的广泛应用奠定了基础。再之后的?11月份,OpenAI?再发力,GPTs?的到来,“用户自定义ChatGPT”的能力,更是让世人领略了?OpenAI?作为LLM?一哥的宏大叙事能力与强劲技术实力。sgpjbg二
2、、New?Bing(Bing?AI)代表了微软在?LLM?领域的野心和决心,它首次把当时世人能想到最有价值又可行的?LLM应用场景“智能对话+联网搜索”无缝整合了起来,大有干掉搜索行业和问答社区的趋势,而后事实证明,全球最强?IT?问答社区?Stack?OverFlow?深受其害。?Google?紧随其后推出?Bard,作为其首次亮相的对话LLM?产品,无疑具有其里程碑意义,尽管它的首秀并不尽如人意,车翻了又翻。三、Claude?2、PaLM?2、Llama?等模型与产品也展现了?LLM在语言理解和多模态处理能力方面的探索,甚至?Claude?2还一度被誉为实力可以硬刚?ChatGPT。而?M
3、eta?开源的Llama?2?更成为了?LLM?领域开源势力的典型代表,它的出现,犹如一颗投入平静湖面的石子,激荡起层层水波,?“Llama?2?一开源,全球范围内进入了百模混战阶段”,这个说法一点也不为过。年底的“虚假宣传”?Gemini?与“磁力链开源”?Mistral?8x7B?两大神作,也凭借不输?GPT-4?的实力,将?LLM?狂潮卷到天际。四、Stable Diffusion 和 Midjourney 这两大图像生成系统的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应用,它们突破了传统图像生成方式的局限,仅需要用户提供文字描述,就可以生成高质量的数字艺术作品。它们的图像生成
4、质量、样式多样性和用户便捷性都是极大的突破。这为广大的个人用户和创意行业提供了强有力的工具,彻底改变了数字艺术内容的创作方式。同时,它们也引发了人工智能在创作领域的伦理和法律讨论。LLM 杀进多媒体领域。往后 DALL-E 3 模型升级、Adobe 产品整合 LLM 能力、语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在这条路上的进一步发展。五、AI 编程方面,Copilot 可以根据开发者的代码提示自动补全代码,大大提高了开发效率。这也引发了代码原创性的讨论,但它已经实实在在将 LLM 拉进了编程应用领域。六、LangChain 的出现,实现了 LLM 之间的链式交互,使多个
5、 LLM 模型串联工作,发挥各自的优势,并且可以将LLM 模型与外部数据源进行连接,产生更强大的语言理解和生成效果。这开启了 LLM 集成应用的新方向,并诞生了一个新的细分领域“LLMOps”。七、“提示词工程”,这是 LLM 直接催生出来的新“学科”,它的核心在于研究人类如何与 LLM 更好地进行“沟通”,找到让 LLM 能够准确理解人类意图的方法。提示词工程探索如何以 LLM 可以解析的方式来表达需要它完成的任务,寻找 LLM 的“最佳输入形式”。通过注入提示词,提示词工程建立了一套“人机交互语法”,来更精准地向 LLM 传达想要它生成何种输出的指令。这为人们与 LLM 之间建立高效、准确
6、的“沟通桥梁”提供了可能性。什么“链式思考11(CoT)”、“自动推理并使用工具(ART)”、“思维树(ToT)”甚至运用心理学对 LLM 进行“情绪提示(EmotionPrompt)”,提示词工程俨然在将 LLM 一点一点解剖,试图让人类成为可以将其掌控的“咒术师”。八、AutoGPT 的出现,带着 LLM Agent 的概念进入 LLM发展的新阶段。LLM Agent 是一种基于 LLM 的智能代理,它能够自主学习和执行任务,具有一定的“认知能力和决策能力”。LLM Agent 的出现,标志着 LLM 从传统的模型训练和应用模式,转向以 Agent 为中心的智能化模式。LLM Agent
7、打破了传统 LLM 的被动性,使LLM 能够主动学习和执行任务,从而提高了 LLM 的应用范围和价值;它为 LLM 的智能化发展提供了新的方向,使 LLM 能够更加接近于人类智能。九、AI 原生,目前还没有明确的定义,大致是说,不同于当前各种应用在原本的基础上增加 AI 能力,使其智能化,但它的智能只充当了“辅助”角色;在 AI 原生的语境下,LLM 从一开始就是应用的中枢,应用本身的架构、功能、交互层是围绕 LLM 中枢来构建的。也许 ChatGPT 是最经典的“AI 原生”应用。此概念目前还处在萌芽期,明确的概念、应用场景、架构、技术栈细节等尚未完成自洽。换一种视角来看,这个概念的提出其实
8、都没技术什么事,有人称之为“造商业概念”,这里按下不表。十、镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意义,卷应用机会更大”,其实很深刻地指出了内中区别。本报告以开发者视角为主,从 LLM 切入,但实际上或多或少与 GenAI 脱不开关系。2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬刚”ChatGPT,到后来各式各样的大模型与产品出现,覆盖了不同的领域和场景,构建了多元化的大模型生态。大模型方面,百花齐放:百度的文心一言、抖音的云雀大模型、智谱 AI 的 GLM 大模型、中科院的紫东太初大模型、百川
9、智能的百川大模型、商汤的日日新大模型、MiniMax 的ABAB 大模型、上海人工智能实验室的书生通用大模型、腾讯的混元大模型、蚂蚁的百灵大模型等。另一方面,除了大模型本身,中国在 LLM 相关技术领域也快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLMPrompt 的研究、OneFlow 的深度学习框架。值得一提的还有华为的盘古大模型,其中盘古气象大模型是首个精度超过传统数值预报方法的 AI 模型,速度相比传统数值预报提速 10000 倍以上,能够提供全球气象秒级预报。盘古大模型的研究成果在国际顶级
10、学术期刊自然正刊发表,获得国际学术界的认可。年底,零一万物推出的 Yi 模型,200K 上下文窗口,可处理约 40 万字的文本,成为当时全球大模型中最长的上下文窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。十一、这一小节,通过一些数据来简要概述 2023 年的 LLM、GenAI。根据金融数据和软件公司 PitchBook 的数据,从截至 3 月 29 日追踪的 9 笔交易来看,生成式 AI 公司的投前估值中位数已经飙升至 9000 万美元,高于 2022年的 4250 万美元。PitchBook 的分析师预
11、测,以 32%的复合年增长率计算,到 2026 年,生成式 AI 市场规模将达到 981 亿美元。11由英国知名风投公司Air Street Capital 的合伙人Nathan Benaich 等 作 者 联合 撰 写 的“State of AIReport 2023”报告,从研究进展(Research)、行业局势(Industry)、政策影响(Politics)、安全问题(Safety)、未来预测(Predictions)五个维度出发,对人工智能发展现状和未来预期进行了深度分析。从中我们看到:英伟达凭借各国、初创公司、大型科技公司和研究人员对其 GPU 的巨大需求,跻身市值万亿美元俱乐部;
12、主要芯片供应商开发了不受出口管制影响的替代产品;在 ChatGPT 的带领下,生成式 AI 的应用在图像、视频、编码、语音等领域取得了突破性的进展,带动了180 亿美元的风险投资和企业投资。OReilly发 布 的“2023GenerativeAIintheEnterprise”报告显示:54%的 AI 用户预计 AI 的最大好处是提高生产力。77%的受访者使用 AI 来辅助编程。其中提到的具体应用包括欺诈检测、教学和客户关系管理。AI 用户表示,AI 编程(66%)和数据分析(59%)是最需要的技能。许多 AI 采用者仍处于早期阶段:26%的人使用 AI不到一年,而 18%的人已经在生产中进
13、行了应用。16%从事 AI 工作的受访者表示正在使用开源模型。意外结果、安全性、公平性、偏见和隐私是采用者测试的最大风险。工业和信息化部赛迪研究院数据显示,目前,我国已有超过 19 个大语言模型研发厂商。其中,15 家厂商的模型产品已经通过备案,预计今年我国大语言模型市场规模将达到 132.3 亿元,增长率将达到 110%。到 2027 年,我国大语言模型市场规模有望达到 600 亿元。十二、如果要指出当前 LLM 种种“不成熟”中我最关切的,我会说“LLM 解决方案”。当前 LLM 行业面临的一个大方向上的问题是:还没有很好地从“解决方案”的角度去做技术或者应用。所谓“解决方案”,是指在设计
14、和开发 LLM 技术和应用时,首先明确用户的目标,然后围绕目标进行技术研发和应用设计,并且它带有“整体解决”、“解决的不只是某个单点问题”的含义。只有这样,才能确保 LLM 能够真正解决实际问题,而不是成为“应付式”的工具。“应付式”问题主要表现在以下几个方面:LLM 往往是“一刀切”的,无法根据用户的具体需求进行个性化定制。LLM 往往是“碎片化”的,无法提供完整的解决方案。LLM 往往是“被动式”的,需要用户不断完善输入。什么意思呢?就是我找 AI 是要解决实际问题的,但它往往都是给我“应付”一下,直接交货了事了,而不善于去追问本质,去了解细节,去思考你最终想要的是一个什么样的东西。它需要
15、你不断完善自己的输入,甚至有时候可能要求在你自身都不知道“可以想要一个什么东西”的情况下去输入。这样的话其实就是你在输入与输出:整个事情我都想通了,方案我其实也就都出来了,机器给到我的都只是一个个独立性的、小而窄的、解决掉一点一点问题的东西。举个例子,我说我肚子疼,它会直接告诉我肚子疼可能是因为什么,怎样做可以缓解或者解决,但它不会一点一点进行“望闻问切”全套去引导,了解具体情况,最终再给出切实可行的解决方案。但回过头来想想,这个话题可深可浅,往浅了说,当前 LLM产品可以帮助人类翻译、润色一段文字、提炼论文核心内容,这本身也是较为完整的解决方案;当前 LLM Agent、LLMOps,甚至只
16、是说开发者的各种“工程化组合骚操作”,实际上已经可以把不同模型、不同模态、不同工具和知识源整合,正是在往“提供更完整的解决方案”这一方向上的发展。11往深了说,或许这本质上就是在要求 AGI,而它是一个更长远的路途了。而如何将更完备的解决方案给到用户,如何将更平台化、体系化的生成解决方案的技术给到解决方案生产者,是后续 LLM 应用与技术演进的重要路标。你看 GPTs,直接革掉了多少拿 OpenAI API 去套壳的“创新应用”的命?十三、报告介绍作为2023 中国开源开发者报告的引导,这里还是把话题拉回来,简介一下整个报告。前边讲到的 LLM 领域大放异彩,自然是会作为报告中的一个重要部分,
17、我们策划了一个2023 LLM 技术报告篇章,整体围绕 LLM Tech Map 梳理逻辑来展开。从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。是的,先整理了一个 LLM 技术图谱,欲知详情,请查看后续正文。【开源治理】开源健康发展必不可少的一环。【硬核发版】最硬核、最极客的年度发版汇总!【热门话题】回顾 2023 年度热门开发者事件!【重磅官宣】2023 年度开源官宣。【R.I.P.】谨以此篇纪念今年离我们而去的行业巨擘。https:/ Insight:中国开发者开源新动向是关于开
18、源开发者数据的,采用 Gitee与 OSS Compass 作为数据来源,试图通过数据来反映2023 年开源开发者圈子的相关情况。这里提取几个亮点数据:TypeScript 是增长最快的编程语言,增长率达到49.04%MulanPSL-2.0 在“2023 年使用增长率最快的开源许可证”中排行第二,增长率为 18.34%较为活跃的社区代表:OpenHarmony、openEuler 与MindSpore欢迎查阅、分享。除了 LLM,开源开发者圈当然还有更多高亮事件,我们在此次年度报告中整理成了另一个篇章开源开发者事件回顾,这一篇章梳理成了 9 个大块:【AIGC】回顾 2023 大语言模型 L
19、LM 元年的重磅事件。【1024 黄金眼】关注 IT 相关民生事件,以老百姓的眼睛看 IT 圈,和开发者零距离接触。【项目停更】到了该说“再见”的时候了,江湖有缘再见。【生产事故】冥场面!速来围观 2023 十大生产事故“名场面”。11目录一、开源开发者事件回顾三、中国开发者开源新动向二、2023 LLM 技术报告 46|向量数据库向量数据库 47|数据库向量支持数据库向量支持 48|大模型框架、微调大模型框架、微调 51|大模型训练平台与工具大模型训练平台与工具 53|编程语言编程语言57|知名大模型知名大模型 58|备案上线的中国大模型备案上线的中国大模型 21|硬核发版硬核发版 26|热
20、热门话题门话题 33|重磅官宣重磅官宣 39|R.I.P.R.I.P.07|AIGCAIGC 11|10241024 黄金眼黄金眼 13|项目停更项目停更 16|生产事故生产事故 18|开源治理开源治理 62|插件、插件、IDEIDE、终端、终端 63|代码生成工具代码生成工具 64|LLMLLM AgentAgent 67|LLMOpsLLMOps 68|大模型聚合平台大模型聚合平台 69|开发工具开发工具 70|算力算力出品:OSCHINA&Gitee编委会:雨多田光,OSCHINA 总编局长,OSCHINA 主编王茜,OSCHINA 主编叶子,OSCHINA 新媒体运营鱼仔,OSCHIN
21、A 新媒体运营诺墨,Gitee 开源社区产品负责人张力文,Gitee 公有云研发负责人李泽辰,Gitee 主编李涛,APUS 董事长兼 CEO特邀评论员:陈天舟,Bytebase 联合创始人/CTO王春生,禅道软件公司创始人冯若航,Pigsty 作者、磐吉云数创始人叶金荣,GreatSQL 开源生态负责人杜天微,狮偶编程语言作者江湖评谈,多年.NET 虚拟机技术 CLR/JIT 研究设计:张琪11O Op pe en nA AI I正正式式发发布布G GP PT T-4 4AIGC回顾 2023 大语言模型 LLM 元年的重磅事件。开源开发者事件回顾A An nt th hr ro op pi
22、 ic c推推出出C Cl la au ud de e2023 年 3 月,百度全新一代知识增强大语言模型、文心大模型家族的新成员文心一言(ERNIE Bot)正式发布。百百度度文文心心一一言言正正式式亮亮相相2023 年 7 月,Meta 和微软深度合作,正式推出下一代开源大语言模型 Llama 2,并宣布免费提供给研究和商业使用。相比于 Llama1,Llama 2 的训练数据多了 40%,上下文谷谷歌歌发发布布最最强强A AI I大大模模型型G Ge emmi in ni i2023 年 12 月,谷歌发布了其认为规模最大、功能最强大的多模态 AI 大模型Gemini,称比 OpenAI
23、 的 GPT-4 更先进。MMe et ta a开开源源L Ll la amma a 2 22023 年 3 月 15 日,由 OpenAI 前成员创立的 Anthropic 发布对话 AI 产品Claude,包含 520 亿个参数。与 ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、摘要、写作、编码,以及响应用户的提问。四个月后,Anthropic 推出 Claude 2。Claude 2 改进了性能,响应时间更长,可通过 API 访问。此外还上线了面向公众的 beta 网站 claude.ai。2023 年 3 月 14 日,OpenAI 正式推出 GPT-
24、4。GPT-4 是多模态大型语言模型(Large MultiModal Model),这是和 GPT-3 的一个显著区别,它的输入输出不再局限于文本,可以是图像或者是视频。Anthropic团队由参与OpenAI GPT-2和GPT-3模型开发的前研究人员组建,专注于开发通用 AI 系统和语言模型,并秉持负责任的 AI 使用理念。李彦宏称:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”长度是 Llama 1 的 2 倍,并采用了分组查询注意力机制。具体来说,Llama 2预训练模型是在 2 万亿的 token 上训练的
25、,微调 Chat 模型是在 100 万人类标记数据上训练的。7/8711开源开发者事件回顾A Au ut to o-G GP PT T 横横空空出出世世,席席卷卷 A AI I 圈圈“零零一一万万物物”发发布布 Y Yi i 系系列列开开源源大大模模型型V Ve er rc ce el l 发发布布 v v0 0:根根据据文文本本生生成成 U UI I 代代码码v0 是一款根据文本生成 UI 界面代码的 AI 产品,只要输入文字提示,即可生成需要的 UI 组件界面。智智谱谱 A AI I 开开源源 C Ch ha at tG GL LMM-6 6B B 大大模模型型GPT-4 发布不久后,一款
26、让这个最强大语言模型能够自主完成任务的开源项目Auto-GPT 横空出世,在 AI 领域掀起巨大的波澜。它就像是赋予了GPT-4 记忆和实体一样,让它能够独立应对任务,甚至从经验中学习,不断提高自己的性能。Auto-GPT 是首批将 GPT-4 应用于自动执行任务的程序之一。2023 年 11 月 17 日,OpenAI 突然发布公告,宣布 Sam Altman 将辞去首席执行官一职,并离开 OpenAI 董事会。现任首席技术官 Mira Murati 将临时担任首席执行官,该任命立即生效。LangChain 是封装了大量 LLM 应用开发逻辑和工具集成的开源 Python 库,提供了一套工具
27、、组件和接口,简化创建由 LLM 和聊天模型提供支持的应用程序的过程。创新工场董事长兼CEO李开复今年3月创办AI大模型创业公司“零一万物”。11 月,零一万物推出 Yi-34B 和 Yi-6B 两个开源大模型,对学术研究完全开放。2023 年 3 月,由清华技术成果转化的公司智谱 AI 宣布开源中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用。S Sa amm A Al lt tmma an n 被被“逐逐出出”O Op pe en nA AI I如此突发的重磅消息震惊了全世界,有人称之为美国硅谷史上最大的“夺权”事件。经历 105 小时之后,该事件迎来大结局Sam
28、 Altman 重返 OpenAI 担任首席执行官,OpenAI 成立全新董事会,微软将在董事会中获得一个无投票权的观察员席位。最最火火热热 L LL LMM 应应用用框框架架 L La an ng gC Ch ha ai in n与此同时,零一万物完成由阿里云领投的新一轮融资,估值已超 10 亿美元,跻身独角兽行列。8/8711开源开发者事件回顾京京东东发发布布言言犀犀大大模模型型百百度度推推出出 A AI I 编编程程助助手手 C Co omma at te e 2023 年 3 月,微软亚洲研究院和浙江大学的研究团队联合发布论文HuggingGPT:Solving AI Tasks wi
29、th ChatGPT and its Friends inHuggingFace,介绍了一个大模型协作系统。该系统提出了一种让 LLM 充当控制器的新方法,让 LLM 来管理现有的 AI 模型,来完成多模态的复杂 AI任务,并且使用语言作为通用接口。2023 年 2 月,谷歌首席执行官 Sundar Pichai 宣布,他们将在未来几周内面向公众推出由 LaMDA 提供支持的实验性对话式 AI 服务,称为 Bard与流行的 ChatGPT 展开直接竞争。与此同时,微软开源了基于论文实现的项目 JARVIS。其自我描述是用于连接 LLM 和 AI 模型的协作系统。该系统由 LLM(大语言模型)作
30、为控制器和许多 AI 模型作为协作执行者(来自 HuggingFace Hub)组成。7 月 13 日,京东全面推出京东言犀大模型,服务千行百业,拥抱产业智能。言犀大模型融合了 70%的通用数据与 30%京东数智供应链原生数据,致力于面向知识密集型、任务型产业场景,解决真实产业问题。2023 年 6 月,百度智能云推出了基于大模型的“Comate”代码助手。借助文心大模型的理解、推理能力,“Comate”可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。谷谷歌歌官官宣宣 C Ch ha at tG GP PT T 竞竞品品:B Ba ar rd d2023 年
31、4 月,陈天奇团队(MLC)发布了一个可将大型语言模型和基于 LLM的聊天机器人引入 Web 浏览器的项目:Web LLM。一切都在浏览器内运行,无需服务器支持,并使用 WebGPU 加速。用用 C Ch ha at tG GP PT T 控控制制 A AI I 模模型型陈陈天天奇奇团团队队发发布布 WWe eb b L LL LMM用用浏浏览览器器跑跑大大模模型型微微软软开开源源 J JA AR RV VI IS S(贾贾维维斯斯)依托大模型能力,京东云言犀为客户提供涵盖客户服务、营销导购、多模态数字人等多种营服销一体化解决方案。L LL LMMO Op ps s 平平台台 D Di if
32、fy y.A AI I 代代码码完完全全开开源源2023 年 5 月,LLMOps 平台 Dify.AI 宣布 46,558 行代码完全开源,并临时决定将开源协议从 AGPL 放宽到 Apache 2.0。华华为为云云重重磅磅发发布布盘盘古古大大模模型型 3 3.0 02023 年 7 月,华为云正式发布盘古大模型 3.0。盘古大模型 3.0 是一个面向行业的大模型系列,包括“5+N+X”三层架构。盘古为行业而生,盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。9/8711开源开发者事件回顾蚂蚂蚁蚁集集团团开开源源 C Co od de eF Fu us se e
33、 代代码码大大模模型型阿阿拉拉伯伯语语 A AI I 大大模模型型 J Ja ai is s 开开源源2023 年 11 月 7 日,OpenAI 首届开发者大会(OpenAI DevDay)正式开启。大会上,Sam Altman 宣布了多项重磅变化:GPT-4 Turbo 模型,128k 上下文窗口、GPTs 商店、Agent 工具、API 提速降价、更多的 API 开放。2023 年 8 月,谷歌宣布推出 AI 代码编辑器 Project IDX,一个基于浏览器的开发环境:集成 AI、支持全栈编程语言、跨平台真机预览、一键部署,用于构建全栈网络和多平台应用程序。2023 年 10 月,百川
34、智能发布 Baichuan2-192K 大模型,上下文窗口长度高达 192K,号称是当时全球最长的上下文窗口,能够处理约 35 万个汉字。在上下文窗口长度、长窗口文本生成质量、长上下文理解以及长文本问答、摘要等方面的表现均全面领先 Claude2。2023 年 9 月,蚂蚁集团正式开源代码大模型 CodeFuse基于蚂蚁基础大模型研发。这是蚂蚁自研的代码生成专属大模型,帮助开发者自动生成代码、自动增加注释、自动生成测试用例、修复和优化代码等。2023 年 8 月,阿联酋研究团队宣布开源阿拉伯语大模型 Jais。Jais 是一个经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含
35、 720亿个阿拉伯语词块和 2790 亿个英语/代码词块的数据集上进行训练。谷谷歌歌发发布布 A AI I 代代码码编编辑辑器器:P Pr ro oj je ec ct t I ID DX X2023 年 8 月,Meta 开源了号称是编程领域“最先进的大语言模型”CodeLlama,完全免费且可用于研究和商业用途。百百川川智智能能发发布布 B Ba ai ic ch hu ua an n2 2-1 19 92 2K K 大大模模型型MMe et ta a 代代码码生生成成大大模模型型:C Co od de e L Ll la amma aO Op pe en nA AI I 开开发发者者大大
36、会会宣宣布布 G GP PT Ts s 商商店店用用“磁磁链链链链接接”发发布布的的 MMi ix xt tr ra al l 8 8x x7 7B B全全球球首首个个开开源源 MMo oE E 大大模模型型2023 年 12 月,有“欧洲版 OpenAI”之称的大模型创业公司Mistral AI用磁链链接开源了 87 GB 的 8x7B MoE 模型:Mixtral 8x7B。这是一个开放权重的高质量稀疏混合专家模型(SMoE),采用 Apache 2.0License 开源。在大多数基准测试中,Mixtral 的成绩都优于 Llama 2-70B,且推理速度提升了 6 倍。而且在大多数标准
37、基准测试中超过 GPT-3.5。10/8711爱爱奇奇艺艺客客户户端端“白白嫖嫖”电电视视机机带带宽宽1024“黄金眼”关注 IT 相关民生事件,以老百姓的眼睛看 IT 圈,和开发者零距离接触。开源开发者事件回顾人人大大毕毕业业生生盗盗取取全全校校学学生生信信息息网友发帖称,自己的电视机在息屏休眠状态时,居然持续保持着 1-5M/s 的上传速度,直至断掉电源才停止上传。而这台新买的电视机上安装的 APP 只有爱奇艺。在他强制关闭爱奇艺 APP 后,电视机的上传速度马上变为零。对此,爱奇艺客服给出的回应是,这是加速手段,对使用没有影响,并提供了关闭 HCDN 开关的操作。HCDN(Hybrid
38、CDN)是爱奇艺技术团队研发的大规模混合架构在线视频数据分发技术。有网友指出,这是爱奇艺客户端将电视机当成了自己的 PCDN 服务器,因此会在后台持续执行上传任务。这种白嫖电费、流量、存储空间的操作,爱奇艺要给用户打钱才对。2023 年 9 月,上海警方接到某科技公司员工张女士报案称,其公司发现计算机系统被他人篡改数据,导致公司账户钱款损失。民警对公司后台电子数据出现的异常账户进行提取,搜证中发现,操作者很有可能是管理网站后台系统的员工,监守自盗的可能性较大。程程序序员员篡篡改改 E ET TC C 余余额额河河南南联联通通强强迫迫用用户户更更换换光光猫猫河南周口联通为了强迫用户更换光猫,公司
39、在后台停掉用户的宽带账号,导致用户无法上网,然后让工程师上门“维修”,谎称光猫损坏,需要花 299 元换新。更换完后,联通再在后台恢复用户的网络。员员工工盗盗用用公公司司游游戏戏源源代代码码中国人民大学一名硕士毕业生涉嫌在校期间非法获取全校学生的个人信息,并利用这些信息制作了一个给学生颜值打分的网站。针对“中国人民大学部分学生信息被非法获取”的情况,海淀警方接到报警后立即开展调查。经查,嫌疑人马某某(男,25 岁,该校毕业生)涉嫌非法获取该校部分学生个人信息等违法犯罪行为,后被海淀公安分局依法刑事拘留。上海一游戏公司三名员工利用职务之便,在从原公司离职前盗取了公司开发的手游源代码;并将该手游的
40、源代码提供给了另一家网络公司,对方进行简单“换皮”之后就开始上线经营。创创建建颜颜值值打打分分网网站站结结局局很很“刑刑”一一年年私私吞吞 2 26 60 0 余余万万元元民警随即展开工作,最终嫌疑人曹某迫于压力主动投案自首。曹某是该公司的软件工程师,他坦白称,去年 8 月发现公司网站后台的漏洞,用母亲和朋友身份证注册了两个 ETC 账户。一年内两个账户分别从公司提取来了 230 余万元和 36 万元,总计 260 余万元。最终曹某因涉嫌盗窃罪被依法刑事拘留。“换换皮皮”上上线线 半半年年盈盈利利 1 1.5 5 亿亿为了成功上线,离职员工还套用了原公司的 计算机软件著作权登记证 和 网络游戏
41、出版核发单。警方鉴定发现,两款游戏在服务器数据表和服务器战斗服上的相似度达到 100%,服务器游戏服和客户端相似度也在 90%左右。据统计,自盗版游戏上线半年以来,盈利超过 1.5 亿,盗取源代码的三名员工分得利润超过 1500 万。联通公司不仅对老用户进行这种强制更换光猫的行为,还会在给新用户装机的时候,故意使用破旧光猫,也就是之前强迫用户换新留下的,而再过一段时间之后,又会告诉用户使用的是旧光猫无法匹配,必须换新。联通公司还会故意关掉用户的短信服务,在后台增加增值业务,之后再把短信功能打开,以此牟利。这种强制更换光猫的行为并非新鲜事。早在 2022 年上半年,就有不少用户投诉联通公司,以宽
42、带升级为由强制用户更换光猫,否则就无法上网。其中有的投诉明确是河南联通公司,有的则未明确具体地区。11/8711知知名名大大主主播播翻翻车车现现场场开源开发者事件回顾1 14 40 00 0 多多万万部部老老年年手手机机被被植植入入木木马马B 站 50 万粉丝 up 主通过另一名知名主播购买基于开源软件的导播台方案:将手机摄像头画面推流到 PC,再通过 OBS 推流,使用了 Zerotier+芯象。共计支付 2 万,网友称这名 up 主喜提“超级憨憨大冤种奖”。2023 年 9 月,网传消息称,网易伏羲团队员工因工作原因在出租屋自杀离世;并表示,该员工曾“因 BUG 被 HR 威胁”。9 月
43、14 日,网易伏羲针对此事发布内部信公布事发经过,称员工存在抑郁倾向,HRBP 在了解到情况后为其安排了休假。并表示经过调查还原和分析,暂未发现NanUI 作者在国庆节发布了停更公告,称该项目将暂停开发,原因是去年被裁员失业后,他已转行销售钢材,现在很难腾出时间来开发和维护 NanUI 项目。四川省攀枝花市公安机关网安部门在 2023 年成功侦破一起非法控制计算机信息系统案。经警方调查,犯罪嫌疑人与老年手机方案商、生产商勾结,在老年机生产环节中植入木马程序,在手机使用者不知情的情况下,后台订购 SP 增值业务,并与 SP 商分成获利(SP 即 Service Provider,服务提供商)。2
44、023 年 2 月,公安机关对该案开展集中收网,专案民警分别赶赴广东、北京、海南、湖南等地共抓获嫌疑人 29 名,冻结涉案资金 6000 余万元。苹果 App Store 被发现存在一个伪装成学习软件的黄色软件,并且冲上了免费 App排行榜第一名。该软件的年龄分级为 4 岁以上,但是会引导用户进入赌博和其他黄色网站。有网友下载了这款软件,想要学习英语字母,结果却发现是一个色情视频软件。事件被曝光后,苹果客服虽然进行了“自自动动订订购购”增增值值业业务务网网易易伏伏羲羲回回应应“HR 威胁”相关动机和证据。与此同时,该公司还公布了一系列后续关怀方案。苹苹果果 A Ap pp p S St to
45、or re e 免免费费榜榜第第一一是是黄黄色色软软件件NanUI 界面组件是一个开放源代码的.NET/.NET Core 窗体应用程序(WinForms)界面框架。适用于希望使用 HTML5/CSS3 等前端技术来构建Windows 窗体应用程序用户界面的.NET 开发人员。售售卖卖基基于于开开源源软软件件的的解解决决方方案案,收收费费 2 2 万万员员工工“因因 B BU UG G 被被 H HR R 威威胁胁”离离世世回应,但直到当天下午仍未下架软件。甚至排行榜更新后,App Store 免费榜第一、二名再次出现黄色软件。开开源源框框架架 N Na an nU UI I 作作者者转转行行
46、卖卖钢钢材材项项目目暂暂停停开开发发12/8711网网络络框框架架 A AF FN Ne et twwo or rk ki in ng g 停停止止维维护护开开源源 R RO OMM 魔魔趣趣(MMo ok ke ee e)创创始始人人宣宣布布项项目目结结束束开源开发者事件回顾开开发发者者遭遭死死亡亡威威胁胁,项项目目停停止止开开发发GIF 屏幕录制工具 Peek 的开发者在 2023 年 1 月正式宣布项目停止开发,主要原因在于 Wayland 上运行时所面临的一些技术挑战。而解决问题的唯一途径就是以不同的方式、不同的 UI 完全重写应用程序,但“现在的 Peek 几乎没有什么资源可以重用”
47、。开发者表示自己并没有兴趣再开发一个全新的项目,所以做出了放弃该项目的决定。问问题题堆堆积积如如山山,G GI IF F 录录屏屏工工具具 P Pe ee ek k 停停止止开开发发aardio 编程语言作者发文表示,因妻子患癌,再无精力维护项目。aardio的所有库基本都是由作者一个人编写,并且 17 年来一直保持非常活跃的更新。aardio 是一门专注于桌面软件开发的编程语言,特点是小、轻、快,体积仅 6.5MB,学习和使用成本极低。aardio 虽然小,但提供了惊人数量的开源标准库、扩展库 这些库基本都是由纯 aardio 代码实现。开开源源项项目目 T To ou uc ca a 开开
48、发发商商倒倒闭闭开 源 测 试 工 具Touca 的 创 始 人Pejman Ghorbanzade 于 2023 年 3月宣布其公司正式倒闭,不景气的市场大环境是倒闭的一个主要原因。Pejman 于 2021 年创立了 Touca,并于 2022 年 5 月在 Apache-2.0许可下开源。Touca 公司倒闭后,Touca 这个开源项目还将继续存在,并保持开源,Pejman 表示自己会持续维护这个项目,并开始寻找新的机会。a aa ar rd di io o 编编程程语语言言作作者者:因因妻妻子子患患癌癌,再再无无精精力力维维护护项项目目因遭受过多的骚扰甚至于死亡威胁,AetherSX2
49、 软 件 的 开 发 者Tahlreth 于2023 年 1 月宣布无限期停止该项目的开发。“AetherSX2 对我来说一直是一个有趣的爱好,而不是为了盈利。继续开发一个不再有趣的项目是没有任何意义的。”AetherSX2 是 Android 平台上最好用的PlayStation 2 模拟器(没有之一)。用户还可以继续下载和使用 AetherSX2,但该应用程序已经不再有进一步的开发计划。国内最大的非营利性开源 ROM 项目魔趣(Mokee)在 2023 年 1 月 7日正式宣布关闭。魔趣下载页面所有固件已备份到 sourceforge。项目作者马丁龙猪发文称,“刷机的时代其实早已落幕,迟迟
50、下不定决心只是希望能让魔趣多存续一些时间,但该来的终究会来。”Mokee 全称 MoKee OpenSource,项目发起于 2012 年 12 月 12 日。早期基于 CyanogenMod(CM),2016 年CyanogenMod 停止开发,后开始基于AOSP。魔趣开源项目 20121212 20230107在停更近 3 年后,适用于苹果旗下多个操作系统(iOS、macOS、watchOS 和 tvOS)的网络框架AFNetworking 在 2023 年 1 月17 日正式发布公告宣布弃用,停止维护。原始仓库将作为一个归档库永久保留。项目停更到了该说“再见”的时候了,江湖有缘再见。13
51、/8711战战争争、疫疫情情、通通货货膨膨胀胀,资资源源网网站站 R RA AR RB BG G 宣宣布布关关闭闭Q Qt t 5 5.1 15 5 L LT TS S 已已结结束束标标准准支支持持开源开发者事件回顾资资金金严严重重短短缺缺,又又一一流流行行开开源源项项目目宣宣布布停停止止功功能能开开发发“李跳跳”作者于 2023 年 8 月在公众号宣布无限期停止更新,原因是收到了某集团律师函,对方称“李跳跳”APP涉嫌不正当竞争,对旗下的浏览器产生影响,并要求四十八小时内全网下架“李跳跳”。“李跳跳”是一款利用无障碍权限进行跳过 APP 开屏广告的 Android 辅助应用,无需联网,免费使
52、用。除了“李跳跳”,其他同类开屏广告应用也都在同一时期收到了律师函,比如“大圣净化”、“一指禅”和“叮小跳”。自自动动跳跳过过开开屏屏广广告告应应用用李李跳跳跳跳无无限限期期停停更更微软于 2023 年 8 月发布了 Visual Studio for Mac 的退役公告。未来,开发团队将专注于增强 Visual Studio 和 VS Code,优化它们以进行跨平台开发。Visual Studio for Mac 退役后,微软方面仍会为 Mac 开发者提供替代方案,例如 C#Dev Kit for VS Code 和其他扩展。开开源源富富文文本本编编辑辑器器 wwa an ng gE Ed
53、di it to or r 暂暂停停维维护护开源 Web 富文本编辑器 wangEditor 作者王福朋于 2023 年 8 月宣布暂停项目维护。主要原因在于作者暂无精力维护 wangEditor,且“最近行业形势也不太好,先努力搞钱吧”。他也欢迎有人接手 wangEditor 的维护,不过需要通过初步考核:在issues 列表中,回答 10 个 issue。微微软软官官宣宣:V Vi is su ua al l S St tu ud di io o f fo or r MMa ac c 退退役役libjpeg-turbo 的首席开发人员 DRC 在完成该项目的 3.0.0 版本发布后表示,由
54、于资金短缺,其未来的功能开发或将受到限制,可能永远不会有libjpeg-turbo 3.1 版本。他将继续修复 libjpeg-turbo 中的错误,并在 3.0.x 发行版系列中发布错误修复版本;但不会再有 libjpeg-turbo 3.1 发行版系列,除非该项目可以获得更多的通用资金。自 2024 年 8 月 31 日起,Visual Studio for Mac 将不会再获得任何支持。届时,VisualStudio for Mac 将只能通过,为已订阅 Visual Studio 的用户提供旧版安装,但不再提供服务或维护。Qt 5 系列的最后一个次要版本 Qt5.15 LTS 于 20
55、23 年 5 月 26 日正式结束标准支持。Qt 5.15 LTS 是一个长期支持版本,有三年的标准支持期。最后一个补丁版本是 Qt 2023 年 5 月 25 日发布的5.15.14,适用于具有旧许可证的商业客户的标准支持条款。受战争、疫情、通货膨胀等因素影响,资源网站 RARBG 于 2023 年年中宣布关站。RARBG 是一个著名的 BitTorrent 网站,提供了许多高质量的电影、电视剧、音乐、游戏和软件等种子资源。它成立于 2008 年,总部位于保加利亚,已经成为了 BitTorrent 社区中备受喜爱的网站之一。libjpeg-turbo 是一个 JPEG 图像编解码器。它使用S
56、IMD 指令(MMX、SSE2、AVX2、Neon、AltiVec)来加速 x86、x86-64、Arm 和PowerPC 系统上的基线 JPEG压缩和解压缩,以及 x86、x86-64和 Arm 系统的渐进式 JPEG 压缩。14/8711L Li in nu ux x 4 4.9 9 正正式式 E EO OL L结结束束持持续续 6 6 年年的的 L LT TS S 周周期期微微软软计计划划在在 WWi in nd do owws s 中中淘淘汰汰写写字字板板开源开发者事件回顾J JS S 工工具具库库 l lo od da as sh h关关闭闭所所有有 i is ss su ue e
57、和和公公开开 P PR RMySQL 目前已经成为中国用户使用最广泛的开源数据库,其中 5.7 版本用户的比重又是最高的。根据报告中的统计数字,MySQL 5.7 用户占比在国内高达 47%。届时这些用户将会面临选择,如何应对 EOL 事件。MMy yS SQ QL L 5 5.7 7 于于 2 20 02 23 3.1 10 0.2 21 1 正正式式 E EO OL L承承载载微微软软跨跨平平台台生生态态之之梦梦的的 U UWWP P,正正在在消消亡亡开发者发现,微软最新的 Windows 11 Canary Build 25987 预览版已经开始提供两个版本的 XAML Shell 服务
58、,新的版本直接基于 Win32+XAML,曾经被寄予厚望的 UWP 在新版本里已经不见踪影。老 牌JS 工 具 库lodash 关 闭 了 所 有issue 并 统 一 打 上issuebankruptcy 的 tag,此外还关闭了所有公开 PR,表示无力处理,一关了之。微软在 2023 年 9 月宣布计划在未来的 Windows 更新中弃用写字板。对于.doc 和.rtf 等富文本文档,该公司建议使用 Microsoft Word 作为替代品;对于.txt 等纯文本文档,则建议使用 Windows 记事本。在长达 6 年多的长期支持后,Linux 4.9 内核系列在 Linux 4.9.33
59、7 更新中结束了生命周期。Linux 内核 4.9 于 2016 年 12 月 11 日发布,它带来了对 XFS 文件系统的共享范围和写时复制支持、用于检测固件引起的延迟的硬件延迟跟踪器、对来自 Project Ara 的 Greybus 总线的支持、更高效的 BPF 分析器、新的可选BBR TCP 拥塞控制算法、虚拟映射内核堆栈等特性。由于是 LTS 版本,Linux 4.被广泛用于生产环境,比如基于 Linux 4.9 操作系统驱动的大规模生产设备/硬件。写字板是一种基本的文本编辑应用程序,允许用户创建和编辑带有格式化文本的文档,并包含图像和其他文件的链接。自1995 年 Windows
60、95 发布以来就附带在 Windows 系统上,为用户提供集成到操作系统中的基本文字处理器和文档编辑器。特特邀邀评评论论员员 陈陈天天舟舟,B By yt te eb ba as se e 联联合合创创始始人人/C CT TO O2023 年 10 月,MySQL 5.7 宣布了 EOL,算是给 MySQL 5 系,这个支撑了过去 15 年中国互联网的功勋做了一个告别。随着 MySQL 的辞旧,PG 的崛起,在这 AI 的黎明,VR 的前夜,下一个 15 年,MySQL 和 PG 之间相爱相杀的故事又该会如何演绎呢。特特邀邀评评论论员员 叶叶金金荣荣,G Gr re ea at tS SQQL
61、 L 开开源源生生态态负负责责人人对于 MySQL 5.7 的 EOL,我想需要分几种情况区别对待。1.已经在线稳定运行的系统,认为升级版本存在一定风险。在做好必要的安全防范措施后,一般是无需担心 EOL 带来的安全风险,最大的问题无非是用不上新功能。相当多互联网企业都是这么做的。从 MySQL 5.6 占比仍高达 30%也可见一斑。2.想要用上新特性,借机升级版本。MySQL 8.0 及更高版本中的一些企业级特性的确吸引人,值得升级体验。在这里也特别推荐我在负责的 GreatSQL 分支,无论从功能还是性能上说都比 MySQL 更实用、更放心。可能会有人推荐选择MariaDB,从生态完善及成
62、熟度等多方面评估来看,我是持反对意见的。3.对于需要所谓原厂服务保障的场景,这种只能跟着 MySQL 官方走了,没啥说的。15/8711B B 站站(哔哔哩哩哔哔哩哩)崩崩了了两两次次生产事故“名场面”冥场面!速来围观 2023 十大生产事故“名场面”开源开发者事件回顾腾腾讯讯“3 32 29 9”一一级级事事故故2023 年 3 月 5 日晚 20:20 左右,许多网友表示在使用 B 站时,手机和电脑端都无法访问视频详情页,且手机端无法查看收藏夹与历史记录。还有网友表示,上海品茶能够正常加载,但全部是繁体字。8 月 4 日晚间,距离上次事故 5 个月后,又有许多网友反馈 B 站图片(视频封面)无
63、法加载、视频无法打开、视频一直在缓冲。2023 年 6 月 8 日下午,中国电信的网络和通信服务出现无信号等失灵现象,绝大部分反馈的用户都在广东区域,疑似广东省内故障。该问题在广大社交平台上引起热议,受影响的电信用户反馈,首先是信号关停,然后恢复到 2G 网络,但迟迟未能恢复到 4G 或 5G 网络。此后中国电信客服回应表示,电信基站全省(广东电信)故障,暂时不能拨打电话,请耐心等待,现在紧急加急处理中,不便之处,敬请谅解。历时 4 个小时左右,广东省内电信网络全面恢复。中中国国电电信信大大规规模模无无服服务务3 月 29 日,“唯品会崩了”登上热搜,由于崩溃时间太长,影响了很多消费者无法正常
64、下单。唯品会官方对此回应称,因系统短时故障,主站“加购”等功能或出现异常。后续唯品会对此次事件严肃处理,对应部门的直接管理者承担此次事故责任,基础平台部负责人予以免职作相应处理。微微软软A Az zu ur re e 故故障障 生生产产级级数数据据库库被被删删5 月 24 日,微软 Azure DevOps 在巴西南部地区的一处 scale-unit 发生故障,导致宕机约 10.5 个小时。Azure DevOps 工程师在数据库删除开始后 20 分钟内检测到中断,并开始着手修复。最终数据全部恢复,但却花费了长达十个小时。后续微软首席软件工程经理 EricMattingly 出面针对此次故障事
65、件道歉,并透露了导致中断的原因:即,一个简单的拼写错误致使 17 个生产级数据库被删除。唯唯品品会会崩崩了了 登登上上热热搜搜2023 年 3 月 29 日凌晨,腾讯旗下的微信和 QQ 等业务曾出现崩溃状况,包括微信语音对话、朋友圈、微信支付,以及 QQ 文件传输、QQ 空间和 QQ 邮箱在内的多个功能无法使用。直到 29 日早间,腾讯微信团队才回应表示,经工程师抢修,系统正在逐步恢复。本次事故由广州电信机房冷却系统故障导致,腾讯将它定义为公司一级事故,并对大量相关领导做出了处罚。4 月 12 日,工业和信息化部信息通信管理局听取腾讯公司关于“329”微信业务异常情况汇报,要求腾讯公司进一步健
66、全安全生产管理制度、落实网络运行保障措施,坚决避免发生重大安全生产事故,切实提升公众业务安全稳定运行水平。16/8711语语雀雀1 10 0.2 23 3 重重大大服服务务故故障障开源开发者事件回顾阿阿里里云云1 11 1.1 12 2 重重大大服服务务故故障障2023 年 10 月 23 日语雀出现重大服务故障,持续 7 个多小时才完全恢复。语雀团队后续公布了故障原因及处理过程:10 月 23 日下午,服务语雀的数据存储运维团队在进行升级操作时,由于新的运维升级工具 bug,导致华东地区生产环境存储服务器被误下线。受其影响,语雀数据服务发生严重故障,造成大面积的服务中断。2023 年 11
67、月 27 日晚间,滴滴因系统故障导致 App 服务异常,不显示定位且无法打车。随后滴滴出行官方回复称是因系统故障导致。11 月 28 日早间,滴滴出行消息称,网约车等服务已恢复,骑车等在陆续修复中。在滴滴发出公告的同时,记者在上海、深圳等地使用滴滴呼叫网约车,发现网约车功能并未恢复使用,网络加载异常,仍无法打车。11 月 28 日,滴滴向记者回应称,网约车服务已恢复,司机乘客权益陆续恢复补发。11 月 29 日,滴滴再次发文致歉,称初步确定事故起因是底层系统软件发生故障。滴滴滴滴1 11 1.2 27 7 史史上上最最严严重重服服务务故故障障马斯克收购 Twitter 并大幅裁员后,导致网站的
68、服务可靠性出现显著下降。某天再度出现了严重的宕机故障无法打开任何图片和链接。具体表现为,当用户在推特上加载图片和点击链接时会返回错误信息,称“您当前的 API 不包括对此端点的访问权限”。消息人士表示,此次事故由一名工程师修改配置导致,据称马斯克知道此事后直接暴怒。C Ch ha at tG GP PT T服服务务中中断断 2 2 小小时时北京时间 11 月 8 日晚 22 点左右,OpenAI 旗下 ChatGPT 以及相关 API 出现中断故障,导致面向用户和开发者的服务近 2 小时无法正常使用。随后 OpenAl更新事故报告称,已确定了一个导致 API 和 ChatGPT 错误率高的问题
69、,正在努力修复。与此同时,OpenAI CEO 山姆奥特曼公开致歉称:本周发布的新功能遇到远超预期的使用量。由于负载的原因,短期内可能会出现服务不稳定的情况,对此情况向用户道歉。推推特特严严重重宕宕机机 马马斯斯克克暴暴怒怒2023 年 11 月 12 日下午,阿里云出现严重故障,全线产品受影响。后续官方确认故障原因与某个底层服务组件有关。在历时约 5 个小时后,阿里云宣布受影响云产品均已恢复。特特邀邀评评论论员员冯冯若若航航,P Pi ig gs st ty y 作作者者/磐磐吉吉云云数数创创始始人人根据海恩法则,一次严重故障的背后有几十次轻微事故,几百起未遂先兆,以及上千条事故隐患。去年十
70、二月阿里云香港机房的大故障已经暴露出来许多问题,然而一年后又给了用户一个更大的惊喜(吓!)。这样的事故对于阿里云的品牌形象绝对是致命打击,甚至对整个行业的声誉都有严重的损害。17/8711S St ta ab bl le e D Di if ff fu us si io on n 因因版版权权问问题题被被起起诉诉开源开发者事件回顾为为打打破破中中美美领领先先,G Gi it tH Hu ub b C CE EO O:开开源源开开发发者者应应免免受受欧欧盟盟 A AI I 法法案案约约束束2023 年 3 月,由于双方规则冲突,curl 作者 Daniel Stenberg 宣布,将不再向各 L
71、inux 发行版的邮件列表发送有关 curl 安全漏洞的提前预告。curl 新的政策导致,在通知各发行版的时候,这些安全问题已经在公共的git 存储库中提交了修复程序,而按照发行版邮件列表的政策规定,公开的安全问题则属于”禁运“的话题。c cu ur rl l 作作者者宣宣布布不不再再向向各各发发行行版版发发送送安安全全漏漏洞洞预预警警在经历了多次治理风波后,为了解决导致领导层危机的潜在结构性问题,结束组织内部混乱局面。2023 年 2 月,Rust 项目发布了一项有关新的治理计划的 RFC;旨在建立了一个领导委员会(Leadership Council)以替代原本的核心团队(Core Tea
72、m),委员会将其大部分权力下放给各团队。6 月,Rust 项目还宣布成立新的顶级治理机构:领导委员会(RustLeadership Council)。该领导委员会的成立,标志着 Rust 核心团队和临时领导者职位都将被取消,此后将由 Rust 理事承担顶级治理问题的责任。开开源源许许可可证证亟亟需需更更新新摆摆脱脱 1 19 98 80 0 年年代代束束缚缚、应应对对人人工工智智能能科技媒体The Register发布了一篇探讨更新开源许可证的文章,指出:开源许可证需要摆脱 20 世纪 80 年代的束缚,并不断发展以应对人工智能。自由软件和开源许可证在 20 世纪 70 年代和 80 年代的主
73、要作用对象逐步演变成“代码”。但今天,它必须再次转型以处理人工智能模型。R Ru us st t 管管理理结结构构大大改改:解解散散核核心心团团队队、成成立立“领领导导委委员员会会”2023 年初,GitHub CEO Thomas Dohmke 在欧盟开源政策峰会上对欧盟即将出台的 AI 法案(Artificial Intelligence Act)发表了看法称,开源为政府和企业提供动力,是 欧洲价值观的核心,开源正在构建欧洲 AI 的基础。立法者应该对开源开发者放宽约束,因为开源正在推动 全世界和欧洲的创新之春。欧盟 AI 法案在 2021 年 4 月被首次提出,旨在促进创新,并为 AI
74、技术设定一个全球标准。划分了“不可接受风险的应用程序和系统、高风险应用程序、未明确禁止或列为高风险的应用程序”三个风险类别,并根据相应的风险等级制度来监管 AI 应用程序、产品和服务。三位艺术家对 Stability AI(Stable Diffusion 背后的开发商)提起了诉讼,指控 Stability AI 直接、间接侵犯版权、违反 DMCA 和不正当竞争等。他们认为 Stability AI 在未经原艺术家同意的情况下,从网络上收集了数十亿张图片用于进行 AI 工具训练,侵犯了包括他们在内的数百万艺术家的权利。律师 Butterick 将此案描述为朝着使人工智能对每个人都公平和道德的方
75、向迈出的又一步。开源治理开源健康发展必不可少的一环。但滴水穿石,非一日之功。在 Rust 内部混乱问题尚未解决之际,一些开发者选择了fork Rust语 言 并 创 建 一 个 新 的CrabLang 社区分支,以摆脱“官僚主义”。18/8711东东半半球球最最强强法法务务部部出出手手,开开源源模模拟拟器器D Do ol lp ph hi in n 被被 S St te ea amm 下下架架开源开发者事件回顾A Ap pa ac ch he e 孵孵化化项项目目被被公公然然抄抄袭袭,开开源源世世界界真真的的会会变变得得更更好好吗吗?TII(阿联酋阿布扎比技术创新研究所)在 2023 年 5
76、月推出了号称是“史上最强的开源大语言模型”Falcon(猎鹰)。虽然 Falcon 的参数比LLaMA 小,但性能却更加强大。但 Falcon 采用了自拟的 TII Falcon LLM License在 Apache License的基础上进行了一系列修改。TII Falcon LLM License 要求它的用例需支付商业用途特许权使用费,收入超过 100 万美元的任何商业应用都要收 10%的授权费。此外,对如何发布或分发作品也有额外限制,比如要求归属于Falcon LLMtechnology from the Technology Innovation Institute。在招致诸多骂声
77、之后,Falcon-40B 将 License 修改为 Apache 2.0。号号称称击击败败 L LL La aMMA A 的的大大模模型型开开源源了了,却却因因为为许许可可证证被被骂骂深深圳圳发发力力,打打造造开开源源操操作作系系统统产产业业高高地地2023 年 7 月 28 日,深圳市工业和信息化局印发 深圳市推动开源鸿蒙欧拉产业创新发展行动计划(20232025 年)。目的是推动开源鸿蒙欧拉产业创新发展,助力关键核心技术高水平自立自强,主动拥抱新的技术与产业升级机遇,加快构建现代化产业体系。总体的发展目标是瞄准最高最优最强,通过培育和吸引更多企业、更多人才、更多产业组织集聚深圳发展开源
78、鸿蒙欧拉产业,力争率先将深圳建成为核心技术领先、产业高度集聚、应用场景丰富、生态支撑完备、全球辐射引领的开源鸿蒙欧拉产业高地。2023 年 4 月,流处理应用程序开发管理框架 Apache StreamPark(incubating)发文称,项目代码被赤兔实时计算平台公然大量抄袭。所有引用代码的地方都删除了 Apache License 抬头,并将 Apache License2.0 协议修改成了 GPL 3.0 高调进行开源。多方声讨下,赤兔团队在数日后就其违规行为在官网公开发布了一则道歉声明,并表示已经重新按照 Apache 的合规要求,更新了相关代码并且公开。作为回应,StreamPar
79、k 团队也发布正式声明表示,鉴于赤兔团队良好的认错态度和积极的响应,决定接受道歉。开源合规和知识产权至关重要,身处行业中的你我都应该遵守。海豚模拟器(Dolphin)是一款跨平台的开源模拟器,支持在 Windows、Linux、macOS、Android 上模拟运行任天堂 GameCube 和 Wii 游戏。2023 年 3 月,Dolphin 开发团队宣布将于今年第 2 季度登陆 Steam 平台。但在 5 月,团队表示收到了来自任天堂的警告,宣布无限期推迟上架到 Steam 版本的计划。7 月,Dolphin 确认彻底放弃上架 Steam 平台。事情背后的具体经过为:当得知 Dolphin
80、 要上架 Steam 后,Valve 法务部门联系了任天堂询问相关信息;得到的回应是,按 DMCA 规定 Valve 需要阻止该模拟器登陆 Steam。因此 Valve 要求 Dolphin 必须自行解决与任天堂的协议,否则将无法上架。考虑到这一操作的难度性,Dolphin 最终决定放弃上架 Steam。、Apache StreamPark(incubating)是一个流处理应用程序开发管理框架。初衷是让流处理更简单,旨在轻松构建和管理流处理应用程序,提供使用Apache Flink 和 Apache Spark 等编写流处理应用程序的开发框架。2021 年 4 月 以 StreamX 为名进
81、行开源,于 2022 年 8 月更名为StreamPark,随后通过投票于 9 月正式成为 Apache 开源软件基金会的孵化项目。19/8711“零零一一万万物物”回回应应 Y Yi i 开开源源大大模模型型“套套壳壳”L Ll la amma a开源开发者事件回顾微软在 2023 年 9 月 7 日发布了新版 Copilot 版权承诺,并表示当用户因版权问题受到质疑时,微软将承担潜在的法律责任涉及的风险。新版承诺建立在微软此前的 AI 客户承诺基础之上,将把知识产权赔偿支持扩展到商业 Copilot 服务之中。如果客户在使用 Copilot 等产品时开启了内置的内容过滤器后仍然遭到侵犯版权
82、起诉,微软将为客户辩护并支付因诉讼而产生的任何不利判决或和解金额。微微软软官官宣宣新新的的 C Co op pi il lo ot t 版版权权承承诺诺李开复旗下 AI 公司“零一万物”(01.AI)在 2023 年 11 月推出了Yi-34B 和 Yi-6B 两个开源大模型。其公布的基准测试结果显示虽然模型参数少于其它大模型,但性能更出色。然而在 Yi 正式开源数日后,有人指出 Yi-34B 完全使用了 Meta 开源大模型 Llama 的架构,最明显的变化只是修改了张量(Tensor)名称。根据公开的信息,Yi 系列开源大模型没有在开源 License 中提及 Llama。因此,零一万物的
83、 Yi 系列大模型被质疑是 Llama 的套壳。“零一万物”后续正式公开回应了此事。该公司开源团队总监 Richard Lin回复承认了修改 Llama 张量名称的做法不妥,并会按照建议进行修改。Richard Lin 称此问题是团队的疏忽。因为在大量的训练实验中,他们对代码进行了多次重命名,以满足实验要求。但最后没有在发布之前将它们改回来。他为这个失误造成的混乱表示抱歉。被被泄泄露露的的大大语语言言模模型型 L LL La aMMA A助助长长了了一一系系列列 C Ch ha at tG GP PT T 开开源源替替代代品品开源和基于 API 的分发之间的摩擦是生成式 AI 生态中极为迫切的
84、矛盾。比如在从文本到图像领域,Stable Diffusion 的发布清楚地表明开源是基础模型的可行分发机制。不过在大型语言模型(LLM)领域却并非如此,这些模型只能通过 API 获取。并且这些模型的开源替代品没有表现出相同水平的性能,特别是在它们遵循人类指令的能力方面。然而,一项意想不到的研究突破和泄露的模型版本彻底改变了这一现状。2023 年 3 月,Meta 宣布了它的大语言模型 LLaMA,该模型的一大优势是能运行在单张显卡上。当时 Meta 没有开源 LLaMA,而是通过邀请制的方式出于研究的目的将源代码提供给社区。但在宣布该消息一周后,LLaMA模型在 4chan 上被泄露,有匿名
85、用户通过 BT 种子公开了 LLaMA-65B有 650 亿个参数的 LLaMA,容量为 220GB。在此之后的几周里,这场本应是不幸的事件却成了 LLM 领域最有趣的创新来源之一。自 LLaMA 被泄露后,基于它而构建的 LLM 代理的创新呈现出爆炸式增长。开开源源游游戏戏引引擎擎 G Go od do ot t 成成立立开开发发基基金金在 Unity 引擎宣布 runtime fee 收费模式后,开源游戏引擎 Godot 成立了开发基金(Godot Development Fund)维持项目的独立性,以及可持续性。20/8711MMe ei il li is se ea ar rc ch
86、h 1 1.0 0 稳稳定定版版发发布布WWi in ne e-C CE E 首首个个正正式式版版发发布布开源开发者事件回顾开开源源 3 3D D 建建模模软软件件 B Bl le en nd de er r 发发布布 4 4.0 0Pigsty v2.0.0 于 2023 年 2 月正式发布,带来了一系列重大的功能更新。PIGSTY 是 PostgreSQL In Great STYle 的首字母缩写,即 全盛状态的PostgreSQL。Pigsty 的定位也不再是“开箱即用的 PostgreSQL 数据库发行版”,变成了“Me Better 开源 RDS PG 替代”。P Pi ig gs
87、 st ty y v v2 2 正正式式发发布布经过 3 年多从头开始的打破和重建、彻底的核心改造和全面的引擎重写,历经 17 个 alpha 版本、17 个 beta 版和 6 个 RC 版,Godot 4.0 于2023 年 3 月正式发布。比起常规更新,这更像是一次伟大的重建。C Ce er re es sD DB B 1 1.0 0 正正式式发发布布CeresDB 是一个时序数据库,与经典时序数据库相比,CeresDB 的目标是能够同时处理时序型和分析型两种模式的数据,并提供高效的读写。开开源源 3 3D D 游游戏戏引引擎擎 G Go od do ot t 正正式式发发布布 4 4.
88、0 0主要新特性包括:Cycles 支持光和影的耦合,支持光滑表面的路径引导,支持苹果 Metal API 的 MetalRT 硬件光线追踪,HIP 后端支持 AMD RDNA2和 RDNA3 APU,默认 UI 字体 Inter,Linux 和 macOS 版最低要求 OpenGL4.3,升级渲染能力,等等。Wine-CE 是在不同指令集架构 Linux 系统上运行 Windows 程序的兼容层,它基于Wine 项目和 Qemu 项目。与 Wine 相比,Wine-CE 可以 模拟 执行 不同 指令 集的Windows 软件,它使用修改过的 Qemu作为指令翻译层。历经三年多的开发,Meil
89、isearch 1.0 首个完全稳定版于 2023 年 2 月发布,可用于生产环境且向前兼容。1.0 的 CLI 工具不仅进入了稳定状态,还新增了许多破坏兼容性的重要变化,使错误处理程序更加直观。Meilisearch 是 Rust 实现的高性能开源搜索引擎,支持方便地集成到任何网站 或应用 程序,支持自 托管(self-hosting),可 作为Algolia 和Elasticsearch 的轻量替代方案。硬核发版最硬核、最极客的年度发版汇总!P Py yT To or rc ch h 2 2.0 0 正正式式发发布布PyTorch 2.0 版本包括稳定版的 Accelerated Tran
90、sformers(以前称为Better Transformers)。PyTorch 是一个 Torch7 团队开源的 Python 优先的深度学习框架。21/8711S Sl li in nt t 1 1.0 0 正正式式发发布布D Dr ra ag go on nf fl ly yD DB B 1 1.0 0 正正式式发发布布开源开发者事件回顾F Fe er rr re et tD DB B 1 1.0 0 正正式式 G GA ALayui 于 2023 年 4 月发布了 2.8.0 的正式版本,以及全新的文档站。“在 Layui 过往七年的开源历程中,从未用多达二十个预览版去为一个正式版而
91、引路。显然,2.8.0 是 Layui 一次朴实的回归,更是情怀的延续。”L La ay yu ui i 2 2.8 8.0 0 正正式式发发布布,朴朴实实归归来来经过漫长的测试,foobar2000 于 2023 年 4 月底正式发布了 2.0 版本,标志着 foobar2000 发布 21 年后终于进入 2.0。foobar2000 是一款免费的高级音频播放器软件。D De el lp ph hi i 1 11 1 和和 C C+B Bu ui il ld de er r 1 11 1 社社区区版版发发布布Embarcadero 在 2023 年 4 月为 Delphi 11 和 C+Bu
92、ilder 11 发布了提供了可免费使用的社区版,具体版本号为 11.3。发布公告写道,社区版用户现在可以使用 Delphi 11 Alexandria Pro 版本中的里程碑式创新,包括支持高分屏(4K 显示器)、改进对 VCL 和 IDE的远程桌面支持、针对多窗口和多显示器显示的改进。f fo oo ob ba ar r2 20 00 00 0 正正式式发发布布 2 2.0 0FerretDB 1.0 于 2023 年 4 月正式 GA,达到生产可用。这是一个开源的MongoDB 替代品,建立在 PostgreSQL 之上,并在 Apache 2.0 许可下发布。Dragonfly 1.0
93、 完全支持 Redis 最常见的数据类型和命令,以及快照、主从复制和高可用等特性。DragonflyDB 是一个现代化的开源内存数据库,兼容 Redis 和 Memcached API,迁移时无需修改任何代码,可作为两者的替代方案。Slint 1.0 于 2023 年 4 月发布,标志着项目已顺利从开发阶段“毕业”,可正式用于生产环境。Slint(最初称为 SixtyFPS)是一个 Rust 编写的综合性 UI 工具包,用于为桌面和嵌入式设备构建原生用户界面。P Py yt th ho on n 深深度度学学习习框框架架 K Ke er ra as s 3 3.0 0 一一统统江江湖湖Kera
94、s 3.0 被誉为改变了机器学习游戏规则:不仅支持 TensorFlow、PyTorch、Jax 三大框架作为后端,还能在它们之间无缝切换,甚至混合使用。据称有 250 多万开发者都在使用Keras 框架。Keras 之父 Franois Chollet 表示:欢迎来到多框架机器学习。22/8711Q Qwwi ik k 1 1.0 0 发发布布,全全栈栈式式 WWe eb b 框框架架前前端端 U UI I 框框架架 S Sv ve el lt te e 4 4 发发布布开源开发者事件回顾B Bl li in nk k 1 1.0 0 正正式式发发布布ECMAScript 是标准化的 Jav
95、aScript 语言,于 1997 年发布了第一版,现已发展成为世界上使用最广泛的通用编程语言之一。E EC CMMA AS Sc cr ri ip pt t 2 20 02 23 3 正正式式发发布布openKylin 1.0 版本默认搭载 6.1+5.15 双内核,完成 20+操作系统核心组件自主选型升级,并新增许多新特性,修复超千个 bug,进一步提升系统整体稳定性和兼容性,为用户带来更好体验。A Ar rc c 浏浏览览器器正正式式发发布布 1 1.0 0Arc 官网广告语直接引用了媒体评价:Arc is the Chrome replacement Ive been waiting
96、for.Arc 旨在成为一个“万维网的操作系统”,并试图将网页浏览与内置应用程序和功能整合在一起。Arc 基于 Chromium 并用 Swift 语言编写。o op pe en nK Ky yl li in n 1 1.0 0 重重磅磅发发布布Blink 1.0 于 2023 年 6 月正式发布。Blink 是无特权用户空间虚拟机,支持在任何 POSIX 平台上模拟 x86-64-linux 二进制文件,声称是最小的x86 Linux 模拟器。总的来说,它是一个 220kb 的无依赖静态二进制文件,实现了大约 600条 x86 指令和 180 条 Linux 系统调用。距离 Svelte 3
97、 发布过去了四年多的时间,Svelte 4 稳定版本于 2023 年 6 月正式发布。新版本改进了性能、优化了开发者体验,并大改了网站。Svelte 4 主要是一个维护版本,它为下一代的 Svelte 发布奠定了基础。Qwik 是一个全栈式 Web 框架,Qwik 基于 React、Angular 和 Vue 等其他 Web 框架的概念,但以 JavaScript 流等更新的方法脱颖而出,允许以高性能向用户交付复杂的 Web 应用程序。D Da ar rt t 3 3 正正式式发发布布,1 10 00 0%健健全全的的空空安安全全Dart 3 包含了三个主要改进:完成了 100%健全的空安全;
98、添加了记录、模式和类修饰符的新语言特性;以及对未来进行了预览,即,通过 Wasm 编译扩大了对网络原生代码的平台支持。C Cy yt th ho on n 3 3.0 0 正正式式发发布布经过近五年的漫长岁月,Cython 3.0 于 2023 年 7 月宣布正式发布。Cython 3.0 在各个方面都优于之前的任何其他 Cython 版本。它更加Python 化,与 C 和 C+集成得更好,支持更多 Python 实现和配置,提供了许多很棒的新语言特性。更快、更安全、更易用。Its simply better。23/8711N Ni imm v v2 2.0 0 正正式式发发布布,命命令令式
99、式编编程程语语言言开开源源十十年年后后 C Ca ap p n n P Pr ro ot to o 1 1.0 0 终终发发布布开源开发者事件回顾华华为为正正式式发发布布 H Ha ar rmmo on ny yO OS S 4 4Apache Doris 2.0.0 版本于 2023 年 8 月 11 日正式发布,有超过 275 位贡献者提交了超过 4100个优化与修复。在 2.0.0 版本中,Apache Doris 在标准 Benchmark数据集上盲测查询性能得到超过 10 倍的提升。A Ap pa ac ch he e D Do or ri is s 2 2.0 0.0 0 版版本本
100、正正式式发发布布sudo-rs 是互联网安全研究小组(ISRG)发起的 Prossimo 项目用 Rust重写 sudo 和 su,目标是提升它们在内存方面的安全性,确保它们不再遭受内存安全漏洞的困扰,并进一步增强 Linux 和开源生态系统的安全性。B Bu un n 发发布布 1 1.0 0 正正式式版版本本2023 年 9 月 8 日,JavaScript 运行时 Bun 正式发布 1.0 版本,标志着这个由前 Facebook 工程师创建的项目正式进入稳定生产可用阶段。Bun 的愿景是通过深度整合,让 JavaScript 开发“快如闪电”。s su ud do o-r rs s 发发
101、布布首首个个稳稳定定版版 0 0.2 2.0 0华为 HarmonyOS 4(鸿蒙 4)操作系统于 2023 年 8 月正式发布。全新的 HarmonyOS 4 在隐私安全、AI 大模型能力和个性交互等方面有全新突破。HarmonyOS 4 的小艺是首个具备 AI 大模型能力的智慧助手,可以通过对自然对话的理解,识别出用户意图,很多操作不需要用户用专业的功能术语表达,小艺都可以明白并执行。Capn Proto 是一种速度极快的数据交换格式和 capability-based RPC 系统,于 2013 年4 月开源发布。Capn Proto 1.0 于 2023 年7 月正式发布,这是一个长期
102、支持版本。Capn Proto 项目作者是 Kenton Varda Protocol Buffers version 2 的主要开发者。Nim v2.0 于 2023 年 8 月正式发布,这是一门指令式、通用、多范式、静态类型、编译型的编程语言。2.0 是 Nim 的一次进化,新版本的一项重要特性是将 ORC 内存管理作为默认设置,以及许多其他新功能和改进。J Je et tB Br ra ai in ns s 编编程程工工具具“全全家家桶桶”J Ja av va a 2 21 1/J JD DK K 2 21 1(L LT TS S)G GA AJava 21/JDK21于2023 年 9
103、 月正式 GA。此版本是继 JDK 17 后的长期支持版本(LTS),Oracle 将为其提供至少八年的技术支持和更新。T Ti iD DB B 7 7.5 5 L LT TS S:提提升升稳稳定定性性和和灵灵活活性性年年度度大大版版本本更更新新:2 20 02 23 3.3 324/8711c cu ur rl l 8 8.4 4.0 0 正正式式发发布布开源开发者事件回顾Y Ya ar rn n 4 4.0 0 正正式式发发布布微软称.NET 8 提供了数以千计的性能、稳定性和安全性改进,以及平台和工具增强功能,有助于提高开发者的工作效率和创新速度。.N NE ET T 8 8 正正式式
104、G GA AP PH HP P 8 8.3 3 G GA AYarn 不仅是现代化的JavaScript 软件包管理器,还可以作为项目管理工具。与 3.x 相比,Yarn4.0 引入了不少破坏性变化。此外,4.0 性能方面有了显著提升,其安装速度明显快于 3.6。curl 8.4.0 于 2023 年 10 月正式发布。该版本修复了一个高危安全漏洞:SOCKS5 堆溢出漏洞(heap buffer overflow),该漏洞(CVE-2023-38545)导致 curl 在 SOCKS5 代理握手过程中溢出基于堆的缓冲区。MMo oj jo o 编编程程语语言言开开放放下下载载Mojo 是 M
105、odular AI 公司开发的新编程语言,它结合了 Python 的易用性以及 C 语言的可移植性和性能,目标是使其成为 AI 研究和生产的理想选择。V VS S C Co od de e 实实现现“浮浮动动窗窗口口”特特性性在2023 年11 月 发 布 的vscodeOctober 2023(version 1.84)更新中,开发者呼声极高的 vscode“浮动窗口”特性(预览特性)终于实现。相关提案最初于 2016 年提出,数千人赞同,期间帖子也增长到 300 多条。特特邀邀评评论论员员 江江湖湖评评谈谈(多多年年.N NE ET T 虚虚拟拟机机技技术术 C CL LR R/J JI
106、IT T 研研究究、安安全全领领域域架架构构带带头头人人)有人问.NET 8 好用吗?个人的使用的感官是跟之前的版本比如.NET 6、.NET 7 这些版本在底层上有本质的区别,比如.NET 7 里面修改了上百个性能的问题,JIT 大幅度改动的地方上千次。.NET 8 里面把这些性能问题(OSR、Tiere、PGO、GDEV、Quick 等等)统统进行了默认启动,这是一个跨度很大的改动。但是问题不在于此,而在于.NET 6 升级到.NET 8,甚至于.NET Core 2.0 到.NET8.0 都可以较为丝滑的升级,而极少出错。或者不需要很大的修改才能从低版本升级到高版本。这是因为在托管代码层
107、面,也就 C#源码层面,这些 API 和框架基本上与以前的版本保持了一致或者是兼容性上的极大宽松导致的。从.NET 6 到.NET 8 这两个 LTS 版本来看,微软对于.NET 的升级主要着重于性能的提升,比如每一个版本都比前一个版本都有较大的性能提升。另外一个就是语法糖的包装越来越深厚了,也就是从之前的简单的语法糖包装已经深入到了.NET 骨髓的 CLR 层面的语法糖包装,比如 JIT 优化上面的一些判断和语法树对于 IL 语法糖的值传递进行骚操,以配合.NET 性能提升或者语法的优雅,或者一些其它功能性上的传导。这点可以看下分层或者 PGO 或者是循环提升这些方面的案例。总之,.NET
108、8 算是比较完美的一个版本,值得推荐。但是缺陷依然存在,比如AOT 的适用性并不广泛,MAUI 跨平台的界面框架 BUG 依旧繁多,分层编译Debug 的奇怪 Error 等等。这些问题,只能有待持续性的版本更新解决了。25/8711红红帽帽限限制制 R RH HE EL L 代代码码访访问问热门话题回顾 2023 年度热门开发者事件!开源开发者事件回顾俄俄罗罗斯斯开开发发者者被被阻阻止止为为开开源源软软件件贡贡献献代代码码2023 年初,某国产电商 APP 被安全研究机构披露利用 Android 系统漏洞提权使其难以卸载。此后,卡巴斯基证实该 APP 的部分版本包含恶意代码,利用已知的 An
109、droid 漏洞提权,下载并执行额外的恶意模块,其中一些还获得了访问用户通知和文件的权限。某某国国产产电电商商A AP PP P利利用用A An nd dr ro oi id d 漏漏洞洞提提权权2023 年 3 月 31 日,马斯克终 于 履 行 诺 言 正 式 开 源Twitter 算法,并表示“今天标志着 Twitter 进入了一个透明的新时代。我们正在与全世界共享为推特平台提供底层支持的大部分源代码”。路路透透社社:开开源源软软件件成成为为贸贸易易战战的的重重要要环环节节2023 年 2 月 27 日,路透社发布了 一 篇 评 论 Open-sourcesoftwarebracesfo
110、rtradewar。文章指出,开源软件运动已成为全球创新和生产力增长中前所未有的推动力。然而,不断加剧的地缘政治紧张局势正在危及开源未来的经济贡献。T Twwi it tt te er r 开开源源推推荐荐算算法法2023年3月发生了两起俄罗斯公司开发者被阻止向开源软件(FOSS)贡献代码的事件。一是任职于俄罗斯芯片制造商 Baikal Electronics 的开发者 SergeySemin。Linux 内核邮件列表显示,他以公司员工身份贡献的补丁遭到拒绝。内核维护者回复了简短的通知:我们不愿意接受来自贵组织生产的硬件或与之相关的补丁。2023 年 6 月,红帽宣布了限制源代码访问性的政策,
111、称其企业发行版 RHEL(Red Hat Enterprise Linux)相关源码仅通过 CentOS Stream 公开,付费客户 和 合 作 伙 伴 可 通 过 Red HatCustomer Portal 访问到源代码。8 月,素有“全球白帽黑客奥斯卡奖”之称的网络安全奖项 Pwnie Awards 也在 2023 年度“最差厂商奖”中提名了该厂商。提名理由是:在 App 植入后门、窃听用户信息,被 Google 踢出应用市场,被卡巴斯基实锤曝光后,该厂商不仅拒不承认,还反而指责 Google 的处罚,并悄悄删除恶意代码、解散木马团队。在引发了巨大争议,甚至被指责“背叛”开源后。红帽副
112、总裁 Mike McGrath做出回应称,公司恪守对开源的承诺。他表示,RHEL 是基于 CentOS Stream,而 CentOS Stream 的 GitLab 库是公开的,称 RHEL 闭源完全不正确。红红帽帽副副总总裁裁 MMi ik ke e MMc cG Gr ra at th h 回回应应节节选选:如果是仅仅重新构建代码,而不对现有代码增加价值或进行任何修改,对于所有开源公司来说,这才是真正的威胁。这对开源来说是一个真正的威胁,有可能将开源重新变回到只适用于业余爱好者和黑客的活动。O OS SC CH HI IN NA A 社社区区用用户户L Li ib br re eS So
113、 of ft tc c评评论论:大声和我一起读:不论目的为何,有运行该软件的自由(自由之零)。有研究该软件如何工作以及按需改写该软件的自由(自由之一)。取得该软件源代码为达成此目的之前提。有重新发布拷贝的自由,这样你可以借此来敦亲睦邻(自由之二)。有向公众发布改进版软件的自由(自由之三),这样整个社群都可因此受惠。取得该软件源码为达成此目的之前提。还有一个是俄罗斯芯片制造商 Yadro 的员工 Alexander Amelkin,他的 GitHub帐号在没有任何警告的前提下遭到封锁,所维护的开源项目 ipmitool 也被标记为“已存档”状态。Twitter公司在GitHub上发布了两 个 仓
114、 库(main repo、mlrepo),其中涵盖了推荐算法在内的许多推特源代码,包括用来控制用户在 For You 时间线上看到的推文的机制。文章结尾写道:将世界划分为相互竞争的开源阵营将标志着自由贸易的又一次倒退。这也是对“天下没有免费的午餐”这句古老格言的可悲注脚。锐锐评评:开源无国界,但是开源软件相关公司是有国界的。开源因为贸易战而沦为打击经济发展的重要手段开源事实上有了国界。而很明显,由此带来对整个开源生态乃至供应链的打击是没有国界的。26/8711开源开发者事件回顾U Un ni it ty y 引引擎擎根根据据游游戏戏安安装装量量收收费费自自由由软软件件基基金金会会正正在在消消亡
115、亡MMy yS SQ QL L v vs s P Po os st tg gr re eS SQ QL L:年年度度“圣圣战战”该收费政策给社区带来了巨大混乱和争议,Unity 首席执行官 John Riccitiello因此宣布离职。之后 Unity 向公众和业内人士道歉,并调整了收费规则。在 Godot 4.0 正式发布前,Godot 团队发文探讨了一个问题:Godot 与主流商业产品相比有多大差距?文章阐述了一些尚未实现的功能对于使 Godot 成为更接近商业领域产品的重要性。文章还强调了 Godot 作为免费开源软件的特质这是一个双赢的局面,因为它允许使用者保持创新的自由,同时避免支付
116、昂贵的技术许可费用。卡尔斯鲁厄理工学院(简称 KIT)学生 Jan Strehmel 分析了 GitHub 上大量开源项目的仓库代码,最终发现在多项统计测试中,含有脏话的开源代码比不含脏话的代码质量明显要好。当然,这不意味着脏话越多则代码质量越高。Hare Lang 作者 Drew DeVault 发文称,历时近 40 年,自由软件基金会(FreeSoftware Foundation,FSF)正在走向消亡。G Go od do ot t 离离开开发发 3 3A A 游游戏戏还还有有多多远远?2023 年 8 月,Meta 开源了号称是编程领域“最先进的大语言模型”CodeLlama,完全免费
117、且可用于研究和商业用途。开开源源代代码码质质量量与与脏脏话话的的相相关关性性2023 年中旬,两篇文章引起技术圈热烈讨论:PostgreSQL:世界上最成功的数据库和MySQL:这个星球最成功的数据库。开源中国借此话题顺势举办了线上技术直播现场画面堪称是年度大戏。MMe et ta a 代代码码生生成成大大模模型型:C Co od de e L Ll la amma a2023 年 9 月,Unity 发布公告介绍了新的收费模式,以及配套服务更新:Unity引擎自 2024 年 1 月 1 日起将根据游戏的安装量引入新的 Unity Runtime 费用(runtime fee)。O OS S
118、C CH HI IN NA A 社社区区用用户户哈哈库库纳纳评评论论:正常的商业合作关系是你赚你的钱我赚我的钱。如果你想赚我的钱那么之前的一切商业关系都要重新考虑。Unity 相当于要从“你赚你的钱我赚我的钱”模式转变为“我赚你赚的钱”。Drew 表示 FSF 的成就毋庸置疑,但 FSF 没有重视起传播自由软件理念,开发、发布和推广 CopyLeft 许可证,监督自由软件运动的健康演进这几个核心理念的发展,同时还分心将资源投入到了其他的闲散工作中。O OS SC CH HI IN NA A 社社区区用用户户王王政政评评论论:FSF 的确有问题,但我认为问题并不在文章所说的那些点里面:根本问题是
119、能否创造独属于自由软件的生产方式如果我开发了自由软件,我如何用自由软件维持我的生活?网网友友锐锐评评 你以为的技术论战:性能分析,社区建设,技术架构实际上的技术论战:翻看对手 P5 的定级,嘲笑只能做打工人没有投资,互相出 DBA 的面试题 一家公司成功与失败,跟他们选 MySQL 还是 PG 一毛钱关系都不会有。这次直播效果拉满,我最开始也是抱着看热闹不嫌事大的心态,但是看到后面,觉得嘉宾们很长时间陷入了争论情绪中,有点可惜。没有完美的技术,只有最合适的技术,我最想听嘉宾们讨论什么场景使用什么技术,以及该方案的优缺点,或者从更高的维度来讨论数据库的发展趋势。所以,我对这次直播既觉得有趣,但又
120、有点失望。27/8711开源开发者事件回顾P PH HP P 市市场场份份额额超超 7 7 成成、C CMMS S 中中的的王王者者N Ne ex xt t.j js s 支支持持在在前前端端代代码码中中写写 S SQ QL LC Ch hr ro omme e 支支持持运运行行 J Ja av va a 等等 G GC C 编编程程语语言言2023 年 8 月,微软宣布推出集成到 Excel 中的 Python 公开预览版(Python inExcel),这项特性允许用户在无需进行任何配置的情况下,将流行 Python 语言中的脚本与其常用的 Excel 公式在同一工作簿中组合使用。退休后又
121、被微软招聘的 Python 之父龟叔(Guido van Rossum)也深度参与了Python in Excel项目,他负责架构制定方面的工作。Next.js Conf 2023 展示的一张截图,里面的代码使用了名为ServerActions的特性:在前端代码中使用 SQL 语句直接操作数据库。其团队表示,Server Actions 改进了开发者在编写数据变更方面的体验。但许多人表示这是过去 24 小时内 Twitter 上最让人讨厌的图片。微微软软将将 P Py yt th ho on n 集集成成到到 E Ex xc ce el l谷歌 Chrome 开发者博客在 2023 年 10
122、月底官宣:Chrome 已默认启用WebAssembly 垃圾回收(WasmGC)功能能够将具有 GC 的编程语言编译为 WebAssembly(Wasm)。这意味着 Chrome 将支持运行 Kotlin、Java 等 GC编程语言。WasmGC 是 WebAssembly 社区群组发布的一项提案。通过 WasmGC,将编程语言移植到 Wasm 意味着编程语言的垃圾回收器不再需要成为移植的一部分,而是可以直接使用现有的垃圾回收器。Wikimedia 基 金 会 首 席 工 程 师 TimoTijhof 发表文章An Internet of PHP,并整理了一些 PHP 应用相关的数据。根据W
123、3 Techs对全球前1000万个网站使用的编程语言分析(截至 2023.8),PHP仍然是首选编程语言,占比 77.2%。且绝大多数公开网站都是使用基于PHP的CMS 进行构建。根据市场份额,12 大CMS 软件中有 8 个采用 PHP 编写。O OS SC CH HI IN NA A 社社区区用用户户评评论论T Te el ll lMMe eT Th hi is sO OK K:感觉就像是把保险柜放在大门口,没毛病但是挺危险。w wa ay yl la au u:“Server Actions”名字理解,就是服务器端的代码呀。服务器端写SQL 不很正常嘛。f fa a1 1s se e:前
124、端直连 redis、memcached、mongodb、kafka.的时代即将到来,直接干掉后端运维测试,统一所有 bugO OS SC CH HI IN NA A 社社区区用用户户评评论论J Ja as so on n9 90 09 9:JavaScript 作为动态类型语言,V8 引擎已经对其做了极致的优化,但性能跟 C/C+仍有相当大的差距,想要更高的性能需要静态类型的代码和对其优化的运行环境,于是有了 WASM 的前身 asm.js。AssemblyScript 在实际工作中意义不大,需要改写成高性能的 AssemblyScript 代码的面向计算密集型的 JS代码不多,现有的可以编译
125、成的 WASM 的高性能 C/C+代码很多,何必用AssemblyScript 再写一遍?从当年看到用 asm.js 把 Unity 和虚幻引擎搬到浏览器上,到现在 WASM 虽然还不是很火,但一直在发展。特特邀邀评评论论员员杜杜天天微微,狮狮偶偶编编程程语语言言作作者者Microsoft Office 集成 Python 是拥抱开源的一个表现,也是 Python 甚至是开源的一步胜利。特特邀邀评评论论员员王王春春生生,禅禅道道软软件件公公司司创创始始人人我们对 PHP 有太多的刻板认知了,是时候来刷新下对 PHP 的印象了。PHP 是最适合用来创业或者做项目的语言,没有之一 语法灵活,开发效
126、率高,注重实效。性能自 PHP7 以后有了脱胎换骨的变化。99%的业务场景传统的 PHP 架构可以轻松搞定,更高负载的场景也有了 Swoole 等解决方案。PHP 新版本在保持向下兼容的前提下,也做了大量的语法改进,增强了 PHP 的表现力,也让 PHP更加严谨,更有利于团队协作。PHP 对开发者很友好,没有太多强制的规定,写 PHP 代码会让人很自由,很舒服。不像其他的语言有各种各样奇奇怪怪的强制规定。PHP 社区也有很多更好玩的项目,比如 Swoole,RoadRunner,FrankenPHP。Golang 的出现我认为让 PHP 有了更多的可能。PHP 背后没有大厂,完全是社区运作,这
127、就意味着对中国开发者会比较友好,不用担心被卡脖子。而且 PHP 是中国开发者参与度比较高的一门编程语言。PHP 基金会也成立了有两年了,累计募集了超过 110 万美金的资金,截止今天账面上结余 73 万美金。PHP 基金会目前雇用了 6 位全职或者兼职的 PHP 开发人员。在新的一年里还会计划雇用 4 名开发人员。运作良好,更新有保障。我想对 PHP 这三个字母做一个新的解读:Pragmatic、Humanized、Permanent。这三个单词也是我们所熟知的注重实效、人性化设计和长期主义。在我看来,PHP 这门编程语言和它背后的开发者社区非常深刻地体现了这三种思想。编程语言有各种的选择,每
128、个人也都有自己的喜好信仰。我想跟所有的 PHPer说,相信自己的选择,因为你并不孤单!特特邀邀评评论论员员杜杜天天微微,狮狮偶偶编编程程语语言言作作者者前端支持多语言就像 Node.js 干后端一样,技术的融合会碰撞出更多的想法。但是这些语言适不适合前端的生态,是一个需要时间验证的问题。28/8711开源开发者事件回顾雷雷军军公公布布小小米米澎澎湃湃 O OS S 完完整整系系统统架架构构2.5GHz 龙芯 3A6000 性能可达英特尔 10 代酷睿 3.6GHz i3-10100 的水平,下一步争取使用成熟工艺达到英特尔、AMD 先进工艺 CPU 的性能。龙龙芯芯 3 3A A6 60 00
129、 00 0 桌桌面面处处理理器器正正式式发发布布中中国国开开发发者者团团队队创创建建编编程程语语言言小米澎湃 OS(Xiaomi HyperOS)是小米推出的全新的操作系统,基于深度进化的 Android 以及自研的 Vela 系统融合,彻底重写底层架构。雷军介绍称,小米澎湃 OS 打造了贯穿内核层、服务框架层、跨端层的全端安全系统,尤其是内核层,小米启用了完全独立的“自研微内核安全系统”,保障了安全从最底层实现。深深度度 d de ee ep pi in n-I ID DE E 正正式式亮亮相相deepin 社区于 2023 年 9 月正式官宣 deepin-IDE(深度集成开发环境)由深度
130、公司自主研发,具有多语言、跨平台兼容特性的轻量级集成开发环境。央央视视新新闻闻评评论论龙芯 3A6000 采用我国自主设计的指令系统和架构,无需依赖任何国外授权技术,是我国自主研发、自主可控的新一代通用处理器,可运行多种类的跨平台应用,满足各类大型复杂桌面应用场景。它的推出,标志着我国自主研发的 CPU 在自主可控程度和产品性能方面达到新高度,性能达到国际主流产品水平。O OS SC CH HI IN NA A 社社区区用用户户评评论论p ph hp pe er r0 08 8:i3-10100 的 benchmark 的跑分 8723 分,基本满足办公的需要,下一步争取达到 i5-10400
131、,也就是一万两千分左右。酒酒肉肉朋朋友友:早点把价格打下来,我挺想试一试的。O OS SC CH HI IN NA A 社社区区用用户户评评论论MMi ie eC Ch hi iu u:why you believe this?小小肥肥侠侠:because it is open source.https:/ 2 20 01 14 4:楼上所有说 ide 不是自研的,或者说不行的,都是无知,好好了解工业皇冠上的明珠,有没有这个。不行,每个孩子包括你学会爬到走,都是父母花费很多心血才成的,深度的 ide 同样如此,自研加复用,到完全自研,这不是所有现有公司/产品/现实事务,乃至华为芯,一样的路线吗
132、,这跟那些套皮肯定不一样啊,看现在,看未来,不要看自己的键盘张张亦亦俊俊:这 ui 一看就是自研L Lo oo ok kE Ey ye es s:deepin 造这个轮子应该是为了配套将来玲珑开发环境的吧。不过deepin 真的死磕 C+&Qt 技术了。O OS SC CH HI IN NA A 社社区区用用户户评评论论中中医医药药人人工工智智能能研研究究:虽有 Windows 还是允许 mac,linux 存在嘛,毕竟有竞争才有进步,何况小米一向主打性价比,作为消费者还是喜闻乐见的。n no oy yu ug go o:不太懂?开机显示:Power by Android 不?MoonBit(
133、月兔)是由粤港澳大湾区数字经济研究院(IDEA 研究院)基础软件中心负责人张宏波领导的团队开发的一款编程语言。O OS SC CH HI IN NA A 社社区区用用户户评评论论D Do oe ee ek ki in ng g:个人觉得 Int 大写开头很麻烦,Int 关键字肯定用的很多,相比int 每次都输入可能需要加个 Shift,十分不简洁。吐槽(:_二二猿猿外外:我感觉就是 rust 的变异版本,工具链都一样,源码开放一下,看看本质称称底底层层全全部部重重构构MMo oo on nB Bi it t(月月兔兔)29/8711开源开发者事件回顾微微软软正正在在用用 R Ru us st
134、t 重重写写核核心心 WWi in nd do owws s 库库C+之父 Bjarne Stroustrup表示,自己几十年来一直致力于实现更好、更安全、更高效的 C+。在他看来,NSA 报告中提到的“安全”编程语言在重要应用程序中实际上并不优于 C+。C C+之之父父:R Ru us st t 等等内内存存安安全全语语言言的的安安全全性性并并不不优优于于 C C+n no o-G GI IL L P Py yt th ho on n,启启动动!O OS SC CH HI IN NA A 社社区区用用户户评评论论D Di iy ymmi in ne e:C+都没有包管理机制,这点就很落后,语
135、法上理解相对 C#、Java等语言太冗余了段段体体华华:现代 C+改进很多,例如引入了 Module 管理机制,俨然一个崭新的语言。不过他会成为一种强大的遗留语言。新语言的诞生缺失可以忽略 C+原有的假定和负债,但是面临语言上涉及的相同问题,未必都能拥有完美的方案。日积月累,负债也会越来越多,改进的程度未必赶上 C+的革新程度。例如模板技术在 Java 和 Go 中的诞生过程就可见一斑。之前人们强调语言保持简洁性,到头来仍旧会添加了这些内容,不仅语言超着复杂方面进化,实现功力未必赶得上 C+。Bjarne 说过,世界上只有两种语言,一种没人用,另一种是一边用一边骂的语言。d dw wc cz
136、z:这文章就证明了 C 系语言的没落。就像汇编的没落一样-人们需要的是更先进和更方便的编程方式,而不是语言上的改良。现在 AI 都可以替代一部分工作了,还在讨论语言的安全和高效,已经没意义了。C+之父还没理解人们为何抛弃 C+-如同这篇文章一样,只强调自己理由而无视人们的需求-学院派或当权者经常犯的错误,已经成为他们的行为模式。不愧是 C+之父-谁在风头就“+”谁。好好的语言搞成大杂烩。“静态分析以验证没有不安全的代码被执行”-说白了,就是穷举法。这早就被证伪了。“简化代码的编码规则,使工业规模的静态分析可行。”-你那大杂汇,谁能简化代码的编码规则!“使此类简化代码相当容易编写并确保在需要时进
137、行运行时检查的库。”-还是那句话-遇到个大杂汇语言,谁能简化代码-与其要求别人简化,还是请先简化简化自己语言吧。图图乱乱:语言的设计哲学不一样吧。C/C+(尤其是 C)我记得是说相信程序员知道自己在做什么,这样灵活性很强,上限会很高,但下限也会很低,你要想 s,语言肯定不会拦着你。后来的语言,像 Java 之类的,就开始从语言层面进行限制,拉高代码水平的下限了。冰冰峰峰天天王王:虽然人人都可以随心发言,但是如果没有经历过多种硬件的底层开发,没有经历过每秒处理数十 G 的数据,甚至连基本的代码总数都没有写过十万行以上的,根本无法写软件是在干什么,如果这样的人,也在这个喷master 级的人,就有
138、点可笑了。D Dr ra ay yf fi ir re e:从学程序开始就在写 C+,自从学了 Rust 后,什么都想用 Rust 写。Rust 代码如果能写出来且跑起来,BUG 就很少,这是它的优势,缺点也很明显,需要花的很多时间才能写出来。F Fr ra an nc ce es sc ca a:C+写出来能跑起来,不代表就没有问题了,所以也是需要花很多时间才能写出来一个良好的程序,结果我认为是一样的,一个是先苦后甜,一个是先甜后苦_ _e en n:Rust 如果能替代 C 的话,那么我认为 C+确实会完蛋,否则 C+将会一直存在下去。以我的经历来看,很多项目都能用 C 来开发,只是为了方
139、便一些,用上了 C+,底层还是 C,所谓 C+,不过是 C 的扩展罢了。写 C+核心其实在写 C,你写 Rust 核心是写 C 吗?O OS SC CH HI IN NA A 社社区区用用户户评评论论华华丽丽的的周周遭遭:用 Rust 重写 C+代码我是可以理解的。但是重写 C 代码就没必要。新的项目确实应该与时俱进,拥抱 Rust。權權少少:我倒是覺得相反,Rust 開發效率對比 C+沒大優勢,但是比 C 高。D DB BK Ka an ng ga ar ro oo o:C/C+老一代的人要退场了,而新生代学习 Rust 的人多,可能这才是关键。图图乱乱:我倒是觉得 C/C+太成熟了,需要
140、Rust 来维持 KPI 才是关键。F Fr ra an nc ce es sc ca a:Linux 已经支持 Rust 编写内核模块,Windows 也正在搞了,那么三大系统里面估计只有苹果不会用 Rust 了,因为苹果比较喜欢他的 oc 语言。CPython 核心开发者Thomas Wouters 在2023 年 10 月代表 Python 指导委员会宣布:正式接受 PEP 703 提案(Making theGlobal Interpreter Lock Optional,让全局解释器锁成为可选)no-GIL,或称为自由线程。全局解释器锁(GIL)阻止了同时多线程执行代码,成为了在多核
141、CPU 上提高 Python 代码运行效率的一大障碍。特特邀邀评评论论员员杜杜天天微微,狮狮偶偶编编程程语语言言作作者者:Python 对于多线程的支持一直是个大问题,现在终于看到了一丝曙光。O OS SC CH HI IN NA A 社社区区用用户户评评论论:范范一一舟舟:赶紧,尽快推动实施,挣脱开 gil 的枷锁,Python 才能有更好的发展F Fl la as sk k 之之父父用用 R Ru us st t 编编写写 P Py yt th ho on n 包包管管理理工工具具:R Ry ye e30/8711开源开发者事件回顾A As sa ah hi i L Li in nu ux
142、 x 致致用用户户:停停止止使使用用 X X.O Or rg g,WWa ay yl la an nd d 才才是是未未来来Amazon 的流媒体平台 PrimeVideo 在 2023 年 3 月 22 日发布了一篇技术博客规模化Prime Video 的音视频监控服务,成本降低 90%,副标题:“从分布式微服务架构到单体应用程序的转变有助于实现更高的规模、弹性和降低成本”。这种话题与业内推崇的微服务架构形成了鲜明的对比,从而在技术圈引起了热议。是是微微服服务务架架构构不不香香还还是是云云不不香香?Asahi Linux 首席开发人员 Hector Martin 在 mastodon 发表了
143、一篇帖子,鼓励 Asahi Linux 发行版的用户停止使用 X.Org,因为 Wayland 才是Linux 的未来。前前端端新新轮轮子子 N Nu ue e J JS S,作作者者称称要要打打造造全全新新的的 WWe eb b 生生态态与使用 React 相比,Nue JS 实现同样的功能代码量只有前者的 1/10。O OS SC CH HI IN NA A 社社区区用用户户评评论论独独孤孤影影:Serverless 本来就是一个成本非常高的东西。同样的坑我们也踩过,用 scf 做接入层日志过滤,然后成本高得吓人,性价比非常低。o os sc c_ _7 78 86 69 92 28 80
144、 02 2:我们两三个人的开发团队开发个并发不到 300 的产品竟然使用 java+spring+微服务。本机调试个项目开一大堆工具、idea 都得开 3 个。改个 java 类还得等热部署,写个极其简单的功能实体类、DTO、mapper、接口等要建 20 多个文件,还要应对经常变化多端的业务,搞毛线啊。nginx+php+db 不香吗?大规模、高并发 nginx 负债均衡不就完了?简单的mvc 一个增删改查 2 个小时完成,java 微服务 2 天,真牛 TMD 逼。A Au ut to oP Pl lu us s:UNIX 50 年前就告诉你们了,小而美,把系统拆成多个小的进程,每个进程负
145、责一个专一的任务,进程之间通过最简单的字符流交流,从而形成优雅简单的 ls/|grep|awk 的管道流模型。而微服务没有错误,可以是这种小进程的变体,微服务错误的地方在于,很多人用 Spring Cloud 实现微服务,愚不可及,微服务是进程,而不是 Spring Cloud 进程,使用 K8S+containers,每个 container 是一个进程,这是正儿八经的微服务,确切的说,是进程群系统。O OS SC CH HI IN NA A 社社区区用用户户评评论论大大风风起起兮兮 9 95 52 27 7:不懂就问,TCP 慢启动算法这个靠前端能解决?h ho ou uj j2 2:一切
146、都是基于它“小”,它不能修改 HTTP 协议和相关算法,但它“秘诀在于遵守 TCP 慢启动算法中的 14kb 规则:当包含渲染初始视口的所有内容和样式的 HTML 内容低于 14kb 时,页面加载速度会显着加快”b bi is su u3 33 30 06 6:我选择 jQuery,只要能达到效果。屎一样的代码继续支行。-S SO OR RA A-:我选择 vanilla,连 jQuery 都嫌弃。网网友友锐锐评评 我觉着如果是提 issue 求助的,点个 star 作者帮你,无可厚非。如果是提 bug、改进建议或者 pr 什么的还强要 star 是不是不合理了?如果有个恶性 bug,人家给你
147、提,不点 star 就不改,坑谁呢?所以整体来说这种行为是不合适的。别人提交 issue 是帮助你完善你主导的开源项目,用户才是你的财富。这个意义不大,毕竟靠这个也多不了几个星星,不过这个做法我觉得还是值得鼓励的。N No o S St ta ar r,N No o F Fi ix x开发者向开源项目的GitHub仓库提交issue后,该项目的Bot机器人回复称,此 issue 将被打上 wontfix 标签意思是项目作者不会对其进行修复,并且会关闭 issue。原因是提交 issue 的这位开发者没有 star 该仓库。O OS SC CH HI IN NA A 社社区区用用户户评评论论D
148、De eb bu ug gg ge er rX X-D DE EV V:开发人员的话听听就好不必那么当真,其实就是受限于 Mac的封闭,有太多东西需要从头搞,没精力兼容X11了。我在m1上装Asahi Linux,用最新的 GPU 驱动和 Wayland,真就只是能简单用用,上上网写写文档,完成度和体验还是差用 X.Org 的主力开发机一大截。枫枫_ _林林_ _海海:奇怪的是现在 Wayland 还不稳定。很多应用也要依赖 X.org.但是感觉发行版都在强推 Waylandg gl lr r:不用 X,wsl 上的 remote window 咋个弄法?31/8711开源开发者事件回顾D D
149、H HH H 锐锐评评“打打包包工工具具”:前前端端根根本本不不需需要要构构建建前端生态系统的复杂性是出了名的。在每一层,似乎都存在着不兼容的,相互竞争的标准。为为什什么么前前端端技技术术栈栈如如此此复复杂杂?R Re ea ac ct t 正正在在经经历历 A An ng gu ul la ar r.j js s 的的时时刻刻吗吗?Ruby on Rails 作者 DHH:最快的打包工具就是没有打包(No Build),有了 HTTP/2 以及浏览器原生支持 ES Modules,前端根本不需要构建。S Sv ve el lt te e 正正从从 T Ty yp pe eS Sc cr ri
150、 ip pt t 切切换换到到 J Ja av va aS Sc cr ri ip pt t前端 UI 框架 Svelte 创始人 Rich Harris证实了 Svelte 团队计划 TypeScript 迁移到 JSDoc 的消息。并表示,该决定不会改变 Svelte 的类型安全。负责 Svelte 编译器的开发者表示,改用JSDoc 后,代码不需要编译构建即可进行调试 简化了编译器的开发工作。佚佚名名:jQuery 4.0 历时 4 年开发,与其问它为什么还在更新,不如问为什么仍有那么多人在使用它。这就好比半个世纪以前,人类第三次工业革命产生的电子计算机技术、微电子技术等,到今天仍被广泛
151、应用。仍有用武之地和受众群体,即是 jQuery 仍在更新的理由,它不会突然被所有人弃用,只会在自然规律中慢慢远去。今天那些炙热的主流框架,在未来也将进入相同的循环。致敬 jQuery 4.0。O OS SC CH HI IN NA A 社社区区用用户户评评论论:a as sd df fg gh hj jk kl l1 12 23 34 45 56 67 78 8:还是喜欢原来的前端,现在前端搞的太复杂了o os sc c_ _9 91 12 22 29 97 77 70 0:jquery 强大在于,一个项目 10 年后还可以稳定运行,也可以修改,现在前端如果找不到原来项目源码,过了一年可能无
152、法构建了,就无法修改了。特特邀邀评评论论员员杜杜天天微微,狮狮偶偶编编程程语语言言作作者者:我个人更喜欢纯粹的前端编程,对我来说 Vue+JS 是非常好的组合,无构建。当然在大多数项目里不使用构建确实无法得到最优的代码,所以在大型项目中我不得不为了性能使用构建。O OS SC CH HI IN NA A 社社区区用用户户评评论论:i in nf fo ow wo or rl ld d:所以 TS 真正的作用就是提供类型安全?那如果 Js 加上类型不就没 TS 什么事了?i imma an n1 12 23 3:js+jsdoc 还是很方便的,可以使用到类型检查又可以不用 ts 编译代码,各有利
153、弊,根据实际情况灵活选择即可苦苦行行瓜瓜:对于我这种纯后端的人来说,前端技术知识最小化可用原则即可,做原型够用就行了,TS 学习成本还是太高。特特邀邀评评论论员员杜杜天天微微,狮狮偶偶编编程程语语言言作作者者:前端相对于后端更喜欢用很多单一功能的库来组合出庞大的系统。这点需要复杂的包管理机制,比如 npm。虽然 npm 并不完美,但是跟 Maven 和 APT 一样在尝试解决技术栈问题,未来也会有更多方案。O OS SC CH HI IN NA A 社社区区用用户户评评论论:P Py yn ni ix xWWa an ng g:抛开剂量谈毒性都是耍流氓。x xl l-x xu ue el li
154、 in ng g:我也觉得前端现在搞的太复杂了,jquery 一把梭有啥不好,老是扯什么模块化,难道 jquery 封装好的工具方法就不能叫模块化了吗?后端的发展怎么说也是业务推动着发展的,前端的发展就是程序员自己折腾。资 深React开 发 者FranoisZaninotto 发文表示,对 React 官方推广服务器组件的举措感到担忧。因为这种新的构建 Web 应用程序的方式与大多数现有的 React应用程序不符,会让现有的很多写法都失效。O OS SC CH HI IN NA A 社社区区用用户户评评论论:R Re emmy yZ Za an ne e:本来 react+vite 用得好好
155、的,前几天看到几个前端在鼓吹react+nextjs 合流,说什么 nextjs 也支持 spa。就试着迁移过去,结果把自己坑得七荤八素,最后组件状态保持直接给我劝退了。spa 是从 ssr 进化出来,但又和 ssr 完全不同的产物。一小撮前端为了实现 seo 优化,逆向退化出 nextjs。作为远古人,我需要你们逆向退化吗?是 php 实现不了ssr 还是 python 实现不了 ssr?就算 nextjs 比 php 和 python 有优势(如可以和 spa 项目共享一部分界面组件库),也不能把 nextjs 吹得无所不能吧。这个 nextjs 所谓的 react 的未来,在我看来除了
156、ssr 简直一无是处。j jQ Qu ue er ry y 4 4.0 0 开开发发进进度度:已已完完成成 9 99 9%特特邀邀评评论论员员杜杜天天微微,狮狮偶偶编编程程语语言言作作者者:前端技术复杂吗?这应该是技术和供应链进步带来的结果。就跟城市化一样,不可逆,不可阻挡。32/8711开开源源中中国国完完成成 B B+轮轮战战略略融融资资,7 7.7 75 5 亿亿开源开发者事件回顾A Ap pa ac ch he e b bR RP PC C正正式式毕毕业业,成成为为 A AS SF F 顶顶级级项项目目近日,开源共识(上海)网络技术有限公司(开源中国/Gitee)完成了 B+轮战略融资
157、,此轮融资由天际资本领投,上海科创旗下海望资本联合泰达实业、浦东软件园及张江科投、君联资本、上海国际创投、瑞壹投资、容亿资本、中国移动旗下中移北京基金、中网投、国调科改、联想创投及上海科创共同出资,融资总额达 7.75 亿元人民币。A Ap pa ac ch he e E Ev ve en nt tMMe es sh h正正式式毕毕业业为为 A AS SF F 顶顶级级项项目目2023 年 6 月 1 日,Apache 软件基金会正式宣布 Apache SeaTunnel毕业成为 Apache 顶级项目。这是首个由国人主导并贡献到 ASF 的大数据集成领域的顶级项目。Apache SeaTun
158、nel 原 名Waterdrop,在2021 年10 月 更 名 为SeaTunnel 并申请加入 Apache 孵化器。A Ap pa ac ch he e K Ky yu uu ub bi i正正式式毕毕业业,成成为为 A AS SF F 顶顶级级项项目目2023 年 3 月 9 日,Apache 软件基金会(ASF)官方宣布 Apache Kyuubi正式毕业,成为顶级项目(TLP)。Apache Kyuubi 是一个分布式和多租户网关,用于在数据仓库和湖仓上提供无服务器 SQL。项目最初由网易数帆开发并于 2018 年开源,2021 年 6月捐赠 Apache 基金会,经过 1 年多的
159、孵化,顺利毕业成为 Apache 基金会顶级开源项目。A Ap pa ac ch he e S Se ea aT Tu un nn ne el l正正式式毕毕业业为为 A AS SF F 顶顶级级项项目目2023 年 1 月 26 日,Apache 软件基金会官方宣布 Apache bRPC 正式毕业,成为 Apache 顶级项目(TLP)。bRPC 于 2014 年诞生于百度基础架构部,用 C+编写的工业级 RPC 框架,常用于搜索、存储、机器学习、广告、推荐等高性能系统。2017 年开源,2018 年11 月正式捐献给 Apache 软件基金会。Apache bRPC 是 百 度 继ECh
160、arts 和Doris 之后,又一里程碑式的开源项目。Apache 软件基金会(ASF)孵化器于 2023 年2月15日通过了 Apache EventMesh 项目的孵化毕业投票。2023 年 3 月 22 日,ASF 宣布Apache EventMesh 毕业,成为 Apache 顶级项目(TLP)。Apache EventMesh 是一个多功能平台,它结合了事件驱动和无服务器架构,以简化复杂分布式系统中事件驱动的应用程序开发。Kvrocks 于2022 年4 月 底 加 入 了Apache 孵化器。Kvrocks 是一款分布式 KV 数据库,使用RocksDB 作为底层存储引擎并兼容 R
161、edis协议,旨在解决 Redis 内存成本高以及容量有限的问题,亦可作为海量 KV 数据存储的解决方案。A Ap pa ac ch he e K Kv vr ro oc ck ks s正正式式毕毕业业,成成为为 A AS SF F 顶顶级级项项目目O Op pe en nT Ti in ny y前前端端组组件件库库正正式式开开源源OpenTiny 是一套华为云出品的企业级组件库解决方案,于 2023 年 3 月宣布开源。适配 PC 端/移动端等多端,涵盖Vue2/Vue3/Angular 多技术栈,拥有主题配置系统/中后台模板/CLI 命令行等效率提升工具。重磅官宣2023 年度开源官宣。A
162、pache 软件基金会于美国时间 2023 年 6 月 28 日宣布 Kvrocks 从孵化器毕业成为顶级项目。33/8711不不再再单单一一看看s st ta ar r数数!开开源源指指南南针针O OS SS S C Co ommp pa as ss s发发布布开源开发者事件回顾估量有尺,开源有道。2023 年 2 月 21 日,开源指南针 OSS Compass 发布会在北京顺利举行。OSS Compass 的发布,标志着我国首个开源生态健康评估平台正式诞生。OSS Compass 是一个用于开源生态健康评估的平台,面向 GitHub、Gitee等平台所有开源项目开放。2023 年 6 月
163、 11 日,腾讯正式宣布将打磨多年的编译器软件 OpenKonaJDK 捐赠给开放原子开源基金会,联合基金会以及数以百万计开发者,共建国产编译器基础软件,推动数字基础设施加速突破。2023 年 7 月,百度正式宣布该高性能分布式 MQTT 消息中间件的开源化,并将其命名为 BifroMQ。BifroMQ 的名称灵感来自于北欧神话中的 Bifrst-一座彩虹之桥,连接着人类世界 Midgard 和神祇居住的世界 Asgard,是两个世界间坚实而灵活的通道。百百度度正正式式开开源源 B Bi if fr ro oMMQ QA Ar rk kU UI I-X X 预预览览版版正正式式开开源源2023
164、 年 9 月,蚂蚁研发效能云研发团队宣布开源其基于 OpenSumi 的纯前端 IDE 基础框架。无需容器资源,仅需浏览器即可拥有代码阅读、语法高亮、代码编写、WebSCM 等能力。o op pe en nK Ky yl li in n 正正式式加加入入 R RI IS SC C-V V 基基金金会会2023 年 7 月,openKylin 社区宣布正式加入 RISC-V 基金会,成为其产业联盟成员,为 RISC-V 生态建设贡献更多力量,构筑操作系统与 RISC-V架构软硬件生态协同发展。L Le ea af fe er rJ JS S发发布布:开开源源、性性能能强强悍悍的的2 2D D 图
165、图形形库库腾腾讯讯捐捐赠赠 J Ja av va a 编编译译器器软软件件O Op pe en nK Ko on na a J JD DK KOpenHarmony 项目群技术指导委员会(简称“TSC”)-跨平台应用开发框架 TSG 所孵化项目 ArkUI-X 于 2023 年 8 月正式开源。ArkUI-X 是基于 OpenHarmony官方原生框架 ArkUI 之上扩展的。极极速速版版 I ID DE E 框框架架 C Co od de eB Bl li it tz z 开开源源!N Ne eb bu ul la aG Gr ra ap ph h 出出席席 D Do oc ck ke er
166、 rC Co on n 2 20 02 23 3借助Graph+RAG的契机,NebulaGraph 在国际性技术会议 DockerCon 同世界的技术爱好者们分享了图数据库同 LLM 结合之道。34/8711U Un ni it ty y 引引擎擎中中国国版版“团团结结引引擎擎”正正式式发发布布J Je et tB Br ra ai in ns s 发发布布 R Ru us st t I ID DE E:R Ru us st tR Ro ov ve er r开源开发者事件回顾S So ol lo on n 框框架架,单单月月下下载载量量突突破破 2 20 00 0 万万2023 年 01 月
167、 18 日,Apache 软件基金会官方宣布 Apache Linkis 顺利毕业,成为 Apache 顶级项目(TLP)。Apache Linkis 计算中间件项目,是由微众银行大数据平台团队在 2019年 7 月进行开源,并于 2021 年 8 月正式捐献给 ASF 成为孵化项目,在 2022 年 12 月 03 日通过孵化毕业投票。A Ap pa ac ch he e L Li in nk ki is s 正正式式毕毕业业B By yt te eb ba as se e 突突破破百百万万下下载载Bytebase 是一款开源的面向研发组织设计,聚焦业务数据库开发管理,让数据库变更与版本管理
168、更安全的 Database CI/CD 工具。Bytebase 2.0 大版本于 2023 年 5 月正式发布,支持了 15+种数据库引擎,推出了 Bytebase Cloud 版本,提供完整的 DCM 解决方案,配备了一系列企业级的标准能力,进化成为一个 Database DevOps 平台,管理整个数据库的开发生命周期,一站式覆盖各种数据库的变更,查询,安全,治理场景。并于2023 年 8 月迎来了里程碑:下载量突破了 100 万次。A Ap pa ac ch he e D Do ol lp ph hi in nS Sc ch he ed du ul le er rG Gi it tH H
169、u ub b S St ta ar r 突突破破 1 10 00 00 00 0!2023 年 7 月,Solon 框架宣布单月下载量突破 200 万。Solon 是一个高效的 Java 应用开发框架:更快、更小、更简单。不是Spring,没有 Servlet,也无关 JavaEE;新兴独立的开放生态。主框架仅 0.1MB。2023 年 9 月,JetBrains 发布了专门面向 Rust 开发者打造的独立 RustIDE:RustRover。公开预览期间免费 JetBrains 计划将产品的公开预览持续到最晚 2024 年 9 月。RustRover 支持 Rust、Cargo、TOML、W
170、eb 和数据库技术,以及 IntelliJIDEA 的所有功能,包括 VCS 集成。Unity 中国正式推出 Unity 中国版引擎 团结引擎,同时也开启了Unity 中国本土化进程的全新篇章。作为推动团结引擎落地的核心人物,Unity 中国 CEO 张俊波称致力于将其打造为一款更懂中国开发者的引擎。由国人主导的大数据调度开源项目,ApacheDolphinScheduler GitHub Star 突破 10000,项目迎来一个重要里程碑。这表明 Apache DolphinScheduler 已经在全球的开发者和用户中获得了广泛的认可和使用。DolphinScheduler 旨在解决公司日
171、常运营中的大数据处理工作流调度和执行问题,2018 年以Apache License 2.0 的开源协议发布。目前,Apache DolphinScheduler 项目已应用于 3000+家公司生产实践环境。成成为为 A AS SF F 顶顶级级项项目目35/8711渠渠成成开开源源社社区区成成立立两两周周年年字字节节跳跳动动开开源源 S Sh hmmi ip pc c开源开发者事件回顾C CN NC CF F 社社区区首首个个,K Ku ub be eE Ed dg ge e 达达到到软软件件供供应应链链 S SL LS SA A L L3 3 等等级级Kuasar 是华为云全新的云原生开源
172、项目。在保留传统容器运行时功能的基础上,Kuasar 通过全面 Rust 化以及优化管理模型和框架等手段,进一步降低管理开销、简化调用链路,灵活扩展对业界主流沙箱技术的支持,实现云原生业务场景全覆盖。云云原原生生多多沙沙箱箱容容器器运运行行时时 K Ku ua as sa ar r 开开源源TinyEngine 通过对低代码平台系统常用的功能进行解构,将其划分为多个功能模块,并为每个模块定义了相应的协议和开发范式,使得开发者可以根据自身的业务需求,轻松定制开发出自己的低代码开发平台。新新云云原原生生项项目目 K Kmme es sh h 正正式式开开源源Kmesh 是华为云开源的Serverl
173、ess 流量治理项目。作为集高性能、低开销及安全可靠于一身的内核级云原生流量治理框架,Kmesh 通过将L4、L7 能力卸载到内核,使得转发性能分别提升 50%、60%,开销降低 70%。T Ti in ny yE En ng gi in ne e 低低代代码码引引擎擎正正式式发发布布KubeEdge 社区已于 2022 年 7 月份完成整个 KubeEdge 项目的第三方安全审计,并已发布云原生边缘计算安全威胁分析和防护白皮书。CloudWeGo-Shmipc 是字节跳动服务框架团队研发的高性能进程间通讯库。它基于共享内存构建,具有零拷贝的特点。渠成开源社区将服务更多的开发者,帮助大家解决实
174、实在在的问题。百百度度超超级级链链内内核核将将发发布布国国际际版版:X Xu up pe er rC Co or re e G Gl lo ob ba al l在 2023 开放原子开发者大会上,百度宣布 XuperCore 即将衍生出国际版XuperCore Global,为全球用户提供更高效、更安全、更易用的区块链解决方案。2020 年,百度完成了开源协议的签署,将 XuperChain 的内核技术XuperCore 开源。XuperCore 由百度自主研发,拥有完整知识产权,以“高性能”、“自主可控”、“开源”为主要设计目标,致力于创建“更快、更通用、更好用”的区块链底层技术。基于 Xu
175、perCore 内核发展起来的 XuperChain是领先的区块链开源技术平台。R Ru us st tD De es sk k 1 1.2 2 采采用用 F Fl lu ut tt te er r 重重写写桌桌面面版版RustDesk 是一款开源远程桌面软件,1.2 版本采用 Flutter 重写桌面版本,支持 Wayland 被控。36/8711A Ap pa ac ch he e D Do ol lp ph hi in nS Sc ch he ed du ul le er r 3 3.2 2.0 0 发发布布O Op pe en nF Fu un nc ct ti io on n v v
176、1 1.0 0.0 0 发发布布开源开发者事件回顾A Ap pa ac ch he e S Se ea aT Tu un nn ne el l 发发布布 1 1.0 0 版版本本“WWe eb b”功功能能开源 Zadig 与 企业版 ZadigX 产品合并,并全面启用企业版功能,提供一键试用。服务端源代码完全开放,新文档站和在线教程发布,用户体验全面提升。社区用户获得更多企业级功能,Zadig v2.0.0 提升易用性和性能,工作流效率提高 50%,资源运行成本降低 30%。Z Za ad di ig g 发发布布 V V2 2.0 0 新新架架构构K Ku ub be eS Sp ph h
177、e er re e 3 3.4 4.0 0 发发布布:支支持持 K K8 8s s v v1 1.2 26 6该版本带来了值得大家关注的新功能以及增强:扩大对 Kubernetes 的支持范围,最新稳定性支持 1.26;重构告警策略架构,解耦为告警规则与规则组;提升集群别名展示权重,减少原集群名称不可修改导致的管理问题;升级 KubeEdge 组件到 v1.13 等。Apache SeaTunnel Web 是 SeaTunnel 项目下的一个新组件,专为那些希望通过图形化界面管理和监控其大数据流处理任务的用户设计。不再需要复杂的命令行操作,开发者和数据工程师现在可以在友好的用户界面上轻松配置
178、、提交和管理他们的任务。流处理应用程序开发管理框架 Apache StreamPark(Incubating)2.0.0 于2023 年 2 月正式发布。这是 StreamPark 加入 Apache 孵化器以来发布的第一个版本,也是一个重大功能更新的版本。3.2.0 大版本带来众多更新。包括添加默认租户、新数据源、新任务类型、任务重跑方向控制、远程日志功能、参数优化、资源中心改进、页面易用性增强、云原生支持(包括 Spark on k8S)、新的 Restful API、ETCD 和JDBC 注册中心,以及架构优化等。F Fl lu ue en nt t O Op pe er ra at t
179、o or r v v2 2.0 0 发发布布该版本新增许多重要功能,如 Fluent Bit 新的部署方式:Fluent BitCollector、支持在 fluent-operator 部署添加注释、支持为 fluent-operator和 fluent-bit pods 添加标签、新增在 fluent-bit-watcher 中添加外部插件标志、支持为 Fluent Bit DaemonSet 添加注释等。S So ol lo on n v v2 2.0 0 大大版版本本发发布布Solon 是一个高效的 Java 应用开发框架:更快、更小、更简单。不是 Spring,没有 Servlet,
180、也无关JavaEE;新兴独立的开放生态。主框架仅 0.1 MB。S St tr re ea ammP Pa ar rk k 2 2.0 0.0 0:首首个个 A Ap pa ac ch he e 版版本本37/8711A AP PU US S 发发布布千千亿亿级级多多模模态态通通用用 A AI I 大大模模型型开源开发者事件回顾12 月 19 日,百度正式推出了 Apollo 开放平台的全新升级版本-Apollo 开放平台 9.0,面向所有开发者和生态合作伙伴,以更强的算法能力、更灵活易用的工具框架,以及更易拓展的通用场景能力,继续构筑自动驾驶开发的领先优势。Apollo 开放平台 9.0 的
181、推出,再次让 Apollo 开放平台在工程易用性上向前迈进一大步,降低操作难度、操作成本的门槛,让更多开发者可以简单方便地上手 Apollo 开放平台、投身自动驾驶技术领域。百百度度正正式式推推出出 A Ap po ol ll lo o 开开放放平平台台 9 9.0 0P Po ol la ar rD DB B-X X V V2 2.3 3 集集中中式式和和分分布布式式Katalyst 是字节跳动对多年大规模业务云原生化场景中资源管理能力的抽象和总结,我们期望通过Katalyst的开源直接或间接地帮助用户做好资源管理,实现降本增效。2023 年 4 月,APUS 大模型正式发布。APUS 成立
182、于 2014 年,是一家以产品技术为核心竞争力的全球化人工智能企业,产品及服务已遍及全球 200多个国家和地区,用户量超 24 亿。APUS 大模型是千亿级多模态通用人工智能大模型,具备对文本、图像、音频、视频的深入理解和生成能力,基于此研发出智能问答大师等系列用户端AI 产品,在电商、营销、医疗、网信、教育、制造等多个领域落地应用,致力于为中国定制的 AI 大模型。APUS 积极聚合生态之力,驱动中国 AI 产业高质量发展,与腾讯云、阿里云、百度、深圳大学大数据系统计算技术国家工程实验室合作,集成各自优势,积极推动产业联运等共建方式,与用户、开发者、产业共创健康 AI 生态,为 AI 应用创
183、新和成长提供支持。2023 年云栖大会,PolarDB-X 正式发布 2.3.0 版本,重点推出 PolarDB-X 标准版(集中式形态),将 PolarDB-X 分布式中的 DN 节点提供单独服务,支持paxos协议的多副本模式、lizard分布式事务引擎,可以100%兼容MySQL。同时在性能场景上,采用生产级部署和参数(开启双 1+Paxos 多副本强同步),相比于开源 MySQL 8.0.34,PolarDB-X 在读写混合场景上有 3040%的性能提升,可以作为开源 MySQL 的最佳替代选择。5 5 倍倍提提升升,N Ne eb bu ul la aG Gr ra ap ph h
184、v v3 3.5 5.0 0支支持持 U UD DF F、重重构构索索引引在年中发布的 v3.5.0 版本主要是优化了 FIND ALL PATH 性能,支持了 UDF功能。其中,FIND ALL PATH 的深度性能有大约 50-500%的提升,其中 1 to5 steps大约有600%的提升;Match2HOP_count的性能有15%幅度的提升。字字节节跳跳动动开开源源 K Ka at ta al ly ys st t:在在离离线线混混部部调调度度成成本本优优化化升升级级一一体体化化开开源源发发布布字字节节跳跳动动发发布布自自研研 WWe eb b 构构建建工工具具 R Rs sp pa
185、 ac ck kRspack 是由 ByteDance Web Infra 团队孵化的基于 Rust 语言开发的 Web构建工具,拥有高性能、兼容 Webpack 生态、定制性强等多种优点。38/8711“世世界界头头号号黑黑客客”K Ke ev vi in n MMi it tn ni ic ck k 去去世世纪纪念念陈陈皓皓(左左耳耳朵朵耗耗子子)开源开发者事件回顾Vim 开源文本编辑器作者 Bram Moolenaar 的家人于 2023 年 8 月 5日,在 Google Groups 论坛中公布了 Bram Moolenaar(1961 年-2023年 8 月 3 日)因病去世的消息
186、,享年 62 岁。Bram 一生的大部分时间都在致力于 Vim,创建、维护并不断改进该软件;他为开源软件运动做出了不可磨灭的重大贡献。V Vi imm 之之父父 B Br ra amm MMo oo ol le en na aa ar r 因因病病逝逝世世G GN NU U 自自由由软软件件项项目目贡贡献献者者 T Th hi ie en n-T Th hi iN Ng gu uy ye en n 去去世世GNU Emacs 开发者邮件列表于 2023 年 9 月初公布了一则维护者去世的消息:Goodbye to Thien-Thi Nguyen,并表示他的去世是自由软件世界的巨大损失。根据邮
187、件的描述,Thien-Thi Nguyen(ttn)于 2022 年 10 月去世,他是一位黑客、艺术家、作家,也是许多 GNU 程序和其他自由软件的长期维护者和贡献者。ttn 曾担任 rcs、guile-sdl、alive 和 superopt 软件包的 GNU 维护者,同时还在开发 GNU Go。Thien-Thi 特别喜欢 GNU Emacs、GNU Taler 和 GNU Go,他是 xpm,gnugo,ascii-art-to-unicode、和 hideshow GNU Emacs 软件包的作者和维护者,并对许多其他软件包做出了重大贡献,如 vc 等其他软件包,GNUTaler 及
188、其文档。MegaEase 创始人兼 CEO、资深 IT 技术专家陈皓(网名:左耳朵耗子)因突发心梗于 2023 年 5 月离世,年仅 47 岁。陈陈皓皓追追思思网网站站:https:/ 公司在 GitHub 创建了纪念左耳朵耗子仓库,用于记录关于陈皓本人的点滴回忆。“如果您认识陈皓,或曾经和陈皓打过交道,可通过 PR 来写出您和陈皓的故事,帮助他完成他数字人生的梦想。”被称为“世界头号黑客”的凯文米特尼克(Kevin Mitnick)于 7 月 16日因胰腺癌去世,年仅 59 岁。米特尼克出生于 1963 年 8 月 6 日,是美国计算机安全顾问、作家和黑客。他在 1990 年代参与盗窃大量文
189、件入侵不同公司计算机网络等一系列犯罪行为,被称为当时的头号黑客通缉犯。R.I.P.谨以此篇纪念今年离我们而去的行业巨擘。Vim 是一个功能强大且免费的开源文本编辑器,也是目前最受欢迎的文本编辑器之一,尤其是在程序员中被广泛使用,和 Emacs 并列成为类 Unix系统用户最喜欢的编辑器。39/8711P Po owwe er rP Po oi in nt t 发发明明者者丹丹尼尼斯斯 奥奥斯斯汀汀去去世世开源开发者事件回顾A Ad do ob be e 联联合合创创始始人人 J Jo oh hn n WWa ar rn no oc ck k 去去世世英英特特尔尔联联合合创创始始人人、“摩摩尔尔
190、定定律律”提提出出者者Adobe 官网于 2023 年 8 月 20 日宣布,联合创始人 John Warnock 博士去世,享年 82 岁。Warnock 博士与 Charles Geschke 博士于 1982 年共同创立了 Adobe,第一个产品是 Adobe PostScript。PostScript 是主要用于电子产业和桌面出版领域的一种页面描述语言和编程语言。PostScript 的发明被视为计算机出版的革命。Warnock 于 2000 年从首席执行官职位上退休,并与 Geschke 共同担任董事会主席,直至 2017 年。此后他一直担任董事会成员。2023 年 9 月 1 日,
191、PowerPoint 发明者丹尼斯奥斯汀(Dennis Austin)在美国加利福尼亚州洛斯阿尔托斯(Los Altos)的家中去世,享年 76 岁。奥斯汀的儿子迈克尔奥斯汀(Michael Austin)透露,死亡原因是肺癌转移到大脑。作为 PowerPoint 的首席软件开发工程师,丹尼斯奥斯汀是现代社会信息传播方式的重要塑造者之一。华盛顿邮报的讣告中对 PowerPoint 的评价是:The program was the digital successor of the overhead projector.Itbecame one of the most ubiquitous and
192、 scorned programs of modernoffice life.戈戈登登摩摩尔尔去去世世商商汤汤科科技技创创始始人人汤汤晓晓鸥鸥离离世世,享享年年 5 55 5 岁岁汤晓鸥主要从事计算机视觉相关领域的研究,包括多媒体、计算机视觉、模式识别及视频处理,是全球人脸识别技术的“开拓者”和“探路者”。汤晓鸥教授是我国人工智能领域的杰出代表。他学识渊博、治学严谨、求真务实、开拓创新,富有家国情怀和战略眼光。他甘为人梯、奖掖后学、矢志创新、勇担重任,把全部精力奉献于计算机科学研究,积极推动原创技术发展,为我国人工智能领域科技事业发展做出了卓越的贡献。他二十多年来悉心培养学生,桃李满天下。他们
193、将传承汤晓鸥教授的精神和理念,在发展人工智能的道路上勇往直前。商汤科技创始人、人工智能科学家、浦江实验室主任、上海人工智能实验室主任、香港中文大学教授汤晓鸥因病救治无效,于 2023 年 12 月 15 日 23时 45 分,永远离开了我们,享年 55 岁。英特尔公司和戈登与贝蒂摩尔基金会(Gordon and Betty Moore Foundation)于 2023 年 3 月 24 日宣布,英特尔联合创始人戈登摩尔去世,享年 94 岁。该基金会由戈登摩尔和妻子贝蒂摩尔于 2000 年共同创立,旨在支持科学发现、环境保护和改善患者护理等。1968 年,戈登摩尔与罗伯特诺伊斯一起创立英特尔并
194、任公司副总裁,1975 年出任总裁和首席执行官。戈登摩尔曾提出知名的“摩尔定律”:当价格不变时,集成电路上可容纳的晶体管数目约每隔 18-24 个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔 18-24 个月翻一倍以上。公开信息显示,汤晓鸥 1968 年出生于辽宁鞍山,香港中文大学信息工程学系教授、工程学院杰出学人。汤晓鸥于 1990 年从中国科学技术大学毕业;1991 年获得美国罗切斯特大学硕士学位;1996 年获得麻省理工学院博士学位,之后进入香港中文大学工作;2001 年创立了香港中文大学多媒体实验室;2005 年至 2007 年在微软亚洲研究院工作,担任
195、视觉计算组主任;2008年在深圳先进技术研究院多媒体集成技术研究室工作,担任主任和研究员。40/8741/87L LL LMM 技技术术报报告告大语言模型(LLM)技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。LLM 是利用深度学习和大数据训练的人工智能系统,专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法,从而能够执行各种语言相关任务。以 GPT 系列为代表,LLM 以其在自然语言处理领域的卓越表现,成为推动语言理解、生成和应用的引擎。LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域,GPT 系列模型在文本生成、问答系统和对话生
196、成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面,LLM 技术也发挥了关键作用。此外,它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发,将深入探讨 LLM 技术的背景、基础设施、应用现状,以及相关的工具和平台。42/87L LL LMM T Te ec ch h MMa ap p 向量数据库 数据库向量支持 大模型框架、微调(Fine Tuning)大模型训练平台与工具基基础础设设施施L LL LMM A Ag ge en nt t 备案上线的中国大模型 知名大模型 知名大模型应用大大模模型型算算力力工工具具和和平平台台 LLMOps 大模型聚合平台
197、 开发工具A AI I 编编程程 插件、IDE、终端 代码生成工具编编程程语语言言43/87L LL LMM 技技术术背背景景Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。GPT(Generative Pre-trained Transformer)的提出标志着 LLM 技术的飞速发展,其预训练和微调的方法为语言任务提供了前所未有的性能,以此为基础,多模态融合的应用使得 LLM 更全面地处理各种信息,支持更广泛的应用领域。图源:https:/postgresml.
198、org/docs/.gitbook/assets/ml_system.svg44/87L LL LMM 基基础础设设施施0 01 10 03 30 02 20 04 4向向量量数数据据库库/数数据据库库向向量量支支持持为大模型提供高效的存储和检索能力大大模模型型框框架架及及微微调调 (F Fi in ne e T Tu un ni in ng g)大模型框架提供基本能力和普适性,而微调则是实现特定应用和优化性能的关键环节大模型训练平台&工具提供了在不同硬件和环境中训练大语言模型所需的基础设施和支持编程语言以 Python 为代表45/87L LL LMM 基基础础设设施施:向向量量数数据据库库
199、/数数据据库库向向量量支支持持向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类:原生的向量数据库专门为存储和检索向量而设计,所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括 等均属于原生向量数据库。除了选择专业的向量数据库,对传统数据库添加“向量支持”也是主流方案。比如 等传统数据库均已支持向量检索。46/87L LL LMM 基基础础设设施施:向向量量数数据据库库/数数据据库库向向量量支支持持自 2022 年 Chat
200、GPT 问世以来,大模型星火初始,向量数据库不但获得了技术领域的关注,也逐渐吸引了市场和资本的注意力。近两年来,向量数据库公司迎来了一波融资潮:Pinecone:已融资 Zilliz:已融资 Weaviate:已融资 Vespa:已融资 Chroma:已融资 Qdrant:已融资 Marqo:已融资 LanceDB:已融资 据西南证券研究发展中心预测,2025 年向量数据库渗透率约为 30%,则全球向量数据库市场规模约为 99.5 亿美元,。2023 年前四个月,向量数据库公司融资额,超过了 2022 年的总和(图源:https:/ LL LMM 基基础础设设施施:大大模模型型框框架架及及微微
201、调调 (F Fi in ne e T Tu un ni in ng g)大模型框架指专门设计用于构建、训练和部署大型机器学习模型和深度学习模型的软件框架。这些框架提供了必要的工具和库,使开发者能够更容易地处理大量的数据、管理巨大的网络参数量,并有效地利用硬件资源。微调(Fine Tuning)是在大模型框架基础上进行的一个关键步骤。在模型经过初步的大规模预训练后,微调是用较小、特定领域的数据集对模型进行后续训练,以使其更好地适应特定的任务或应用场景。这一步骤使得通用的大型模型能够在特定任务上表现出更高的精度和更好的效果。大模型框架提供了 LLM 的基本能力和普适性,而微调则是实现特定应用和优化
202、性能的关键环节。两者相结合,使得 LLM 在广泛的应用场景中都能发挥出色的性能。48/87L LL LMM 基基础础设设施施:大大模模型型框框架架及及微微调调 (F Fi in ne e T Tu un ni in ng g)大模型框架有哪些特点:大模型开发框架通过提供高层次的 API 简化了复杂模型的构建过程。这些 API 抽象掉了许多底层细节,使开发者能够专注于模型的设计和训练策略。:这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型的训练和推理过程。:为了处理大型数据集和大规模参数网络,这些框架通常设计得易于水平扩展,支持在多个处理器或多个服务器上并行处理。:它们
203、提供工具来有效地加载、处理和迭代大型数据集,这对于训练大型模型尤为重要。国产深度学习框架 OneFlow 架构(图源:https:/www.oneflow.org/a/chanpin/oneflow/)49/87L LL LMM 基基础础设设施施:大大模模型型框框架架及及微微调调 (F Fi in ne e T Tu un ni in ng g)想要微调一个模型,一般包含以下关键步骤:1.选择预训练模型:选取一个已经在大量数据上进行过预训练的模型作为起点;2.准备任务特定数据:收集与目标任务直接相关的数据集,这些数据将用于微调模型;3.微调训练:在任务特定数据上训练预训练的模型,调整模型参数以
204、适应特定任务;4.评估:在验证集上评估模型性能,确保模型对新数据有良好的泛化能力;5.部署:将性能经验证的模型部署到实际应用中去。微调的过程也是分类模型训练的过程(图源:https:/ LL LMM 基基础础设设施施:大大模模型型训训练练平平台台与与工工具具大模型训练平台和工具提供了强大且灵活的基础设施,使得开发和训练复杂的语言模型变得可行且高效。这些工具提供了先进的算法、预训练模型和优化技术,极大地简化了模型开发过程,加速了实验周期,并使得模型能够更好地适应各种不同的应用场景。此外,它们还促进了学术界和工业界之间的合作与知识共享,推动了自然语言处理技术的快速发展和广泛应用。相比前边的大模型框
205、架和微调,一言以蔽之:、51/87L LL LMM 基基础础设设施施:大大模模型型训训练练平平台台与与工工具具大模型训练平台与工具根据其性质不同,可分为以下几类:这些平台提供了从模型开发到部署的综合解决方案,包括计算资源、数据存储、模型训练和部署服务。它们通常提供易于使用的界面,支持快速迭代和大规模部署。Amazon SageMaker、Google Cloud AI Platform 和 Microsoft Azure Machine Learning 都是提供端到端机器学习服务的云平台。这些工具和库专门为加速机器学习模型的训练和推理而设计,通常利用 GPU 或 TPU 等硬件。这类工具可以
206、显著提高训练和推理的速度,使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此类工具。这类工具通常由开源社区支持和维护,提供了灵活、可扩展的工具和库来构建和训练大型机器学习模型,如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。TensorFlow 架构图(图源:https:/www.geeksforgeeks.org/architecture-of-tensorflow/)52/87L LL LMM 基基础础设设施施:编编程程语语言言LLM 的训练和应用通常使用多种编程语言,取决于
207、任务的需求和团队的偏好。它的广泛使用得益于其简洁的语法、强大的库支持(如)和深度学习框架(如)。此外,C+有时用于优化计算密集型任务,而 Java 在企业环境中处理模型部署和系统集成方面常见。JavaScript 适用于 Web 环境的 LLM 应用。53/87L LL LMM 基基础础设设施施:编编程程语语言言2023 年是大语言模型(LLM)之年,Python 作为人工智能领域使用度最高的编程语言,在 2023 年到底有多火?从各种开发者报告、编程语言榜单来看。只要出现有关编程语言流行度的排名,而 Java、C/C+等同样在 LLM 开发中发挥关键作用的语言紧随其后。54/87L LL L
208、MM 基基础础设设施施:编编程程语语言言 2023 年 9 月面向大众开放创业公司 Modular AI 开发 结合了 Python 的易用性以及 C 语言的 支持与任意 代码 性能是 Python 的 倍Mojo与其他语言性能对比(图源:https:/ 年底大模型应用 ChatGPT 发布后,点燃了世界范围内对于大模型技术及其应用的关注和热情。2023 年,国内外各大厂商均投身于大模型的浪潮当中,涌现了诸多知名的大模型及应用,它们结合了文本、图片、视频、音频多种介质,在文本生成、图片生成、AI 编程等方向均有出色的表现。GitHub Copilot56/87大大模模型型应应用用现现状状:知知
209、名名大大模模型型在全球范围内,已经发布了多款知名大模型,这些大模型在各个领域都取得了突破性的进展。处理文本数据的 GPT-4,能同时处理和理解多种类型数据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了大模型领域的第一梯队。讯飞星火57/87大大模模型型应应用用现现状状:首首批批备备案案上上线线的的中中国国大大模模型型8 月 31 日,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业/机构的大模型产品首批通过生成式人工智能服务管理暂行办法备案,可正式上线面向公众提供服务。具体包括:百度(文心一言)、抖音(云雀
210、大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、百川智能(百川大模型)、商汤(日日新大模型)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)、腾讯(混元大模型,9月15日通过)。58/87大大模模型型应应用用现现状状:知知名名大大模模型型应应用用LLM 已经在多种应用场景中得到了应用,包括文本生成、机器翻译、问答、自然语言推理等。以 为代表的文本生成应用,为代表的图片生成应用,以 为代表的 AI 编程应用,以 为代表的数字人生成应用,在推出后都获得了大量用户的青睐。自然2023 年度十大人物中,ChatGPT 破例成为第 11 人(图源:https:
211、/ AI I 编编程程生成式 AI 正经历前所未有的快速普及,而开发者们正积极将 AI 作为自己的生产力工具,随着众多 AI 编程工具的普及,开发者们使用 AI 辅助工作已经逐渐司空见惯。分析公司 OReilly 日前发布一份2023 Generative AI in the Enterprise报告,报告中指出,。图源:https:/ AI I 编编程程工工具具:插插件件、I ID DE E、终终端端目前最常见的 AI 编程工具大多以插件、IDE 和终端的形式出现,它们大多交互直观且使用门槛低,大大提高了 AI 编程工具的使用率。GitHub Copilot 和 Codeium 是比较常见的
212、 AI 编程插件,而 Cursor 和 Warp 分别是具有 AI 编程能力 的 IDE 和终端工具。除了海外产品,国内如姜子牙、CodeFuse、CodeGeeX、百度 Comate 等都是十分优秀的 AI 编程工具。GitHub CopilotCodeiumWarpCursor62/87A AI I 编编程程新新形形态态:代代码码生生成成工工具具通过原型或图片直接生成包含代码的完整页面,。、都是该形态出色的产品。tldrawv0.devScreenshot to code63/87L LL LMM A Ag ge en nt t(A AI I A Ag ge en nt t)LLM Age
213、nt 是一种基于 LLM 的智能代理,它能够自主学习和执行任务,具有一定的“认知能力和决策能力”。LLM Agent 的出现,标志着 LLM 从传统的模型训练和应用模式,转向以 Agent 为中心的智能化模式。LLM Agent 打破了传统 LLM 的被动性,使 LLM 能够主动学习和执行任务,从而提高了 LLM 的应用范围和价值;它为 LLM 的智能化发展提供了新的方向,使 LLM 能够更加接近于人类智能。AutoGPT 就是一个典型的 LLM Agent。在给定 AutoGPT 一个自然语言目标后,它会尝试将其分解为多个子任务,并在自动循环中使用互联网和其他工具来实现该目标。它使用的是 O
214、penAI 的 GPT-4 或 GPT-3.5 API,是首个使用 GPT-4 执行自主任务的应用程序实例。AutoGPT 最大的特点在于能根据任务指令自主分析和执行,当收到一个需求或任务时,它会开始分析这个问题,并且给出执行目标和具体任务,然后开始执行。图源:https:/blog.abacus.ai/blog/2023/08/31/supercharge-productivity-accomplish-10 x-more-with-ai-agents/64/87L LL LMM 的的工工具具和和平平台台LLMOps大模型聚合平台开发工具:LLMOps 平台专注于提供大模型的部署、运维和优化
215、服务,旨在帮助企业和开发者更高效地管理和使用这些先进的 AI 模型,快速完成从模型到应用的跨越,如、等。:大模型聚合平台主要用于整合和管理多个大型机器学习模型,在聚合平台之上,衍生出 MaaS(Model-as-a-Service,大模型即服务)的服务模式通过提供统一的接口和框架,以更高效地部署、运行和优化这些模型,。:其它开发相关的 LLM 工具,如云原生构建多模态AI应用的工具 Jina,嵌入式数据库 txtai 等。65/87L LL LMM 的的工工具具、平平台台和和资资源源另一个视角来看,在大模型繁荣发展的背后,少不了工具和平台的发力,如 LLMOps 平台、大模型聚合平台以及相关的
216、开发工具,此外还有它们所依赖的最重要的资源算力。在这些工具、平台和资源的有力支撑下,大模型才得以一步一个台阶,引领全球开发者步入一个技术新时代。算力大模型聚合平台LLMOps开发工具66/87L LL LMM 的的工工具具和和平平台台:L LL LMMO Op ps s LangChain 是一个帮助开发者使用 LLM 创建应用的开源框架,它可以将 LLM 与外部数据源进行连接,并允许与 LLM 进行交互。LangChain 于 2022 年 10 月作为开源项目推出,并于 2023 年 4 月注册成立公司,累计获得超过 3000 万美元的投资,估值达到了 2 亿美元。在 GitHub 上,L
217、angChain 已经获得了超过 7 万个 Star 和超过 2000 名贡献者LangChain 架构图(图源:https:/ LL LMM 的的工工具具和和平平台台:MMa aa aS S 平平台台Gitee AI 是开源中国旗下的 MaaS 平台,提供模型、数据集,以及应用托管能力,同时接入了丰富的国产算力平台,为开发者提供了更高效、实惠的微调方案,降低使用门槛,目前已进入内测阶段。68/87L LL LMM 的的工工具具和和平平台台:开开发发工工具具比较有代表性的 LLM 开发工具有:帮助用户极致优化给大模型的提示词(prompt),使得对大语言模型提问时,可以获得更理想的输出。:用于
218、语义搜索、LLM 编排和语言模型工作流的一体化嵌入数据库,可以使用 SQL、对象存储、主题建模、图形分析和多模态索引进行矢量搜索。:专注以 Sketch、PSD、静态图片等形式的视觉稿作为输入,通过智能化技术一键生成可维护的前端代码,包含视图代码、数据字段绑定、组件代码、部分业务逻辑代码。PromptPerfect69/87L LL LMM 世世界界的的基基石石:算算力力LLM 的算力指的是执行这些模型所需的计算资源。这包括用于训练和运行模型的硬件(如 GPU 或 TPU)、内存、存储空间以及处理大量数据的能力。LLM 需要非常强大的算力来处理、理解和生成文本,因为它们涉及到数十亿甚至数万亿个
219、参数的训练和推理。LLM 的基石是算力,而算力的基石是硬件,硬件的性能直接影响着计算任务的速度、效率和能力。是全球领先的 GPU 制造商,提供了强大的图形处理单元,专门用于深度学习和AI计算。AI 处理器和基础软件构建 Atlas 人工智能计算解决方案,打造面向“端、边、云”的全场景 AI 基础设施方案,覆盖深度学习领域推理和训练全流程。被外界视为打破 NVIDIA 垄断 AI 算力市场的多一种选择,其基于第三代 CDNA 架构,为生成式 AI 大语言模型设计的 MI300X 内存高达 192GB,集成了高达 1530 亿个晶体管,为历代产品之最。科技团队自研,面向通用AI计算的芯片核心架构昆
220、仑芯 XPU 从AI落地的实际需求出发,按照复杂前沿的人工智能场景需求开展迭代,致力为开发者提供通用、易用、高性能的算力来源。DCU 系列产品以 GPGPU 架构为基础,兼容通用的“类 CUDA”环境以及国际主流商业计算软件和人工智能软件,可广泛应用于大数据处理、人工智能、商业计算等应用领域。通用 GPU 高端芯片及超级算力系统提供商。拥有云边协同、训推组合的完整通用算力系统全方案,其系统架构、指令集、核心算子、软件栈均为自主研发,可独立发展演进。70/87L LL LMM 世世界界的的基基石石:算算力力算力也是全国乃至世界范围内 LLM 相关企业遇到的最大难题:随着国内大模型数量激增,AI
221、算力需求从 2022 年开始持续上涨,国内市场出现一卡难求的情况。根据 IDC 预计,到 2026 年 AI 推理的负载比例将进一步提升至62.2%,特别是预训练大模型几乎成为 AI 开发的标准范式。同时,这一需求也导致了 NVIDIA A100 GPU 的价格在几个月内暴涨超过 50%,而且大量断货。根据研究测算,单次 GPT-3 模型(175B)训练,在规模 300B token 下成本约为 35000 卡天(A100),也就是相当于 35000 块 A100 GPU 跑 1 天能完成单次训练,或者 2500 块 A100 GPU 跑 2 周。以每张卡 10 万人民币的价格计算,单次训练成
222、本就将达到 25-35 亿人民币。10月17日,美国商务部工业和安全局(BIS)公布新的先进计算芯片、半导体制造设备出口管制规则,限制中国购买和制造高端芯片的能力,受管制的包括但不限于 NVIDIA A100、H100、A800、H800、L40、L40S 以及集成这些高性能计算的 DGX/HGX 系统,并将中国 GPU 企业及其子公司列入了实体清单。据 OpenAI 测算,自 2012 年以来,人工智能模型训练算力需求每34个月就翻一番,每年训练 AI 模型所需算力增长幅度高达 10 倍(图源:https:/ x OSS Compass Insight中国开发者开源新动向本报告数据来源:20
223、23 年 1 月 1 日至 2023 年 12 月 12 日 Gitee 平台相关公开数据及 OSS Compass 相关公开数据73/87生态的根基始终是人2023 年是 Gitee 和开发者见面的第十年。过去十年,Gitee 见证了国内开源的风起云涌和中国开发者对开源逐渐高涨的热情。我们坚信,生态的根基永远是人,而开源生态的根基永远是开发者。1200 万2023 年 Gitee 总用户数达到 1200 万200 万2023 年 Gitee 新增用户 200 万3000 万2023 年 Gitee 总仓库数量达到 3000 万500 万2023 年 Gitee 新仓库数量 500 万74/8
224、7生态的根基始终是人2014-2023 Gitee 用户数增长曲线2014-2023 Gitee 仓库数增长曲线75/87开源组织日益增长十年间,各类多元的开源组织在 Gitee 上成立,他们协助开发者孵化项目,更好地进行协作与管理。同时 Gitee 也不断完善产品能力,为他们提供良好的协作平台。这种研发协同方式打破了传统组织边界,巩固了开源技术迭代,加速了整个中国开源生态发展。2023 年,Gitee 上的开源组织数量达到了 380000 个,除了技术大厂外,个人开发者自发组建的开源组织影响力已经不容小觑。2014-2023 Gitee 开源组织数增长曲线76/872023 年最活跃的开源组
225、织在开源组织活跃度方面,OpenHarmony 凭借其日益强大的生态规模保持着极高的活跃度。在 Gitee 的开源组织中,拥有大厂支撑的开源项目往往拥有着更高的活跃度,这与它们拥有更多的资源,投入了更多的成本不无关系,但这不代表开发者们的民间组织不会被看见。77/872023 年最受关注和喜爱的开源组织最受关注开源组织指2023年获得关注数最多的开源组织(成员5人及以上)最受喜爱开源组织指2023年获得 Star 数最多的开源组织(成员5人及以上)2023 Gitee 最受关注的二十个开源组织2023 Gitee 最受喜爱的二十个开源组织从 2023 年最受开发者关注的和喜爱的开源组织中,可以
226、看出技术大厂凭借其技术底蕴和知名度仍然收获了大部分开发者的关注,但同时由开发者自发形成的开源组织受到了更多开发者的喜爱,如开源组织 Dromara 经过多年发展,已经逐渐有了自己的组织架构、项目捐赠机制和毕业机制,在用心的经营下,Dromara 也在 2023 年共获得了超过 57000 个 Star,是 Gitee 上非大厂背景的开源组织代表之一。78/87编程语言流行趋势Gitee 上 2023 年的编程语言流行趋势与 2022 年相比并没有特别大的变化,依然是 Java、JavaScript、Python 占据前三名。值得一提的是,PHP 与 Go 在 2023 年赶上了近两年备受欢迎的
227、 C 语言家族,作为拥有近三十年历史的老牌语言,PHP 仍在散发着它的光辉。79/872023 增长最快编程语言TypeScript 成为了 Gitee 2023 增长最快的编程语言,增长率达到了 49.04%,这也与过去几年 TypeScript 的增长趋势相吻合,随着支持的框架越来越多,TypeScript 也将迎来更迅猛的发展。除了 TypeScript 外,Rust、Verilog、SQL 也在 2023 年保持着强劲的增长速度。80/872023 年最常用的开源许可证在 2023 年新增的开源项目中,使用 MIT 和 Apache-2.0 许可证的开源项目占比超过了 62%,紧随其后
228、的是国产开源许可证:木兰宽松许可证第二版(MulanPSL-2.0),在成为中国首个被 OSI 认定,成为国际类别开源许可证的三年后,木兰宽松许可证也逐渐成为了中国开发者选择开源许可证的前列选择。81/872023 年增长率最快的开源许可证除了保持增长的木兰宽松许可证外,2023 年更多 Gitee 平台上的开源项目更重视代码透明度和共享理念,防止开源代码被私有化而不贡献社区的情况出现,选择了 GPL 和 AGPL 开源许可证。当然,也有很多开发者坚持自由软件的理念,相对更加宽松的 EPL、BSD 甚至 WTFPL 也在 2023 年受到了更多的欢迎。82/87OSS Compass Insi
229、ght从 Gitee 上线的第一年起,每年都会涌现出许多具有突破性的开源项目。我们选择了十年里最具代表性的十一个项目,它们至今都仍在 Gitee 上保持活跃和维护,借助 OSS Compass,我们有幸一览它们的成长轨迹。正是以它们为代表的,在 Gitee 上数以千万计的开源项目,构成了 Gitee 乃至国内开源生态的坚实地基。Powered by oss-compass.org83/87OSS Compass Insight:协作开发指数开源项目作为人类群体智能的典型表现,是否能够建立协作式的开发管理,是促成项目成功的关键要素。OSS Compass 围绕一系列与代码贡献相关的间接指标,来评
230、估开发流程管理,社区协作式开发做得如何。Powered by oss-compass.org84/87OSS Compass Insight:社区服务与支撑该模型用于评估开发者在贡献过程中,直接感知到的社区提供的服务和支撑做得如何。其中包含了更新 Issue 数量、关闭 PR 数量、Issue 首次相应时间等指标。Powered by oss-compass.org85/87OSS Compass Insight:活跃度活跃度用来描述一个开源社区或者项目的活跃程度。活跃度展示了一个项目随着时间的推移持续展开的工作有多少。高活跃度的社区可能表明该项目是可持续的,低活跃度的社区可能表明该项目面临风险。Powered by oss-compass.org86/87