上周刚落下帷幕的 ApacheCon Asia 2025 中,一个数据让所有人都为之震撼:全球 Apache 基金会项目 OpenRank 排行榜中,Apache Doris 位居第二,在中国 Apache 项目中更是稳居第一

榜单.PNG

这个排名意味着什么?在 Apache 基金会管理的近 300 个顶级项目中,Doris 已经成为仅次于 Apache Airflow 的全球第二大影响力项目。

面对如此迅速的崛起,我们不禁要问:Doris 是如何在短短几年内实现这样的跃升? 而此项排名背后,又蕴含着怎样的意义?

一、中国开源力量的全面崛起

要理解 Doris 的跃升,我们必须把它放在一个更宏观的背景下 --- 中国开源力量的全面崛起

中国开源力量的全面崛起.PNG

在 ApacheCon Asia 2025 的主论坛上,华东师范大学教授 - 王伟老师基于《中国开源年度报告》的数据分析,重点关注中国 Apache 开源社区的参与度、技术贡献和发展趋势,揭示了中国 Apache 开源社区在全球开源生态中的角色与挑战。

中国开源力量的全面崛起-2.PNG

《中国开源年度报告》基于 GitHub 过去十年的观察发现,全球泛开发者总量已突破 1 亿,其中开源开发者数量超过了 2200 万。而在这个庞大的开源生态中,中国正在扮演越来越重要的角色。

数据显示,中国开发者数量超 1000 万人,开源开发者总量约 198 万人,紧随美国、印度位居全球第三。

中国开源力量的全面崛起-3.PNG

但在 Apache 基金会各国开发者贡献度排行榜 Top 20 中,中国在贡献度、开发者总数以及贡献仓库数量等多个维度均排名第一,充分体现了中国开发者在 Apache 项目上的深度参与。

更重要的是,从近五年的趋势来看,中国开发者自 2021 年起贡献度超过美国,并在 2023 年达到峰值,持续保持全球领先地位。

中国开源力量的全面崛起-4.png

另外,报告中还特别强调了一个重要观察:" 中国开发者更注重深度贡献,以美国约三分之一的开发者影响力,却达到了美国开源开发者贡献度总量的近 50%,并且仍在以 7.48% 的增速快速发展。"

这说明什么?中国开发者不是在玩人海战术,而是在打质量牌。我们不仅要参与开源,更要深度参与;不仅要贡献代码,更要贡献核心价值。

二、OpenRank 下的 Doris 现象解析

OpenRank 作为一个系列算法,包含影响力和贡献度两个维度。构建方法与逻辑详见 OpenDigger 文档,该项目是王伟老师团队的一个开源生态数据分析的开源项目。

影响力:https://open-digger.cn/docs/user-docs/metrics/global-openrank

贡献度:https://open-digger.cn/docs/user-docs/metrics/community-openrank

OpenRank 下的 Doris 现象解析.png

OpenRank 作为 **"开源评价的北极星指标"**,提供了全域视角的影响力评估和社区视角的贡献度计算。

从这个角度来分析 Doris 的跃升,我们可以发现三个关键因素:

2.1 技术架构的前瞻性布局

在大数据领域,传统的技术栈往往需要多个组件协同工作,例如:Hadoop 负责存储、Spark 负责批处理、Storm 负责流处理、Elasticsearch 负责搜索分析。这种架构虽然功能完整,但复杂度极高,运维成本巨大。

Doris 的出现彻底改变了这个游戏规则。

技术架构的前瞻性布局.png

它采用了 MPP(大规模并行处理)架构,提供了一体化的 OLAP 解决方案,以高效、简单和统一的特性著称,能够在亚秒级的时间内返回海量数据的查询结果。Doris 既能支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。

基于这些优势,Doris 非常适合用于报表分析、即席查询、统一数仓构建、数据湖联邦查询加速、GenAI 混合检索等场景。用户可以基于 Doris 构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析、数据科学、RAG 等应用。

用户不需要再维护一个庞大的技术栈,一个 Doris 就能解决大部分数据分析问题。

技术架构的前瞻性布局-2.png

从《中国开源年度报告》的分析来看,大数据领域竞争十分激烈:全球排名 Top 20 中,有一半的项目属于大数据领域,包括 Apache Spark、Airflow、datafusion、beam 等。其中 Apache Doris,OpenRank 超过 1700,显著领先于后面的项目。

即便身处如此白热化的竞争之中,Doris 依然能够脱颖而出,很大程度上归功于其技术架构的前瞻性和实用性。

2.2 生态协同的战略定位

技术架构的前瞻性布局-3.png

据报告显示,在中国 Apache 项目 OpenRank 排行榜 Top 20 中,有三个数据库相关项目(Doris、IoTDB、Paimon),体现出国产数据项目在社区影响力和技术成熟度上的持续突破。这已不再是偶然,而是整个生态协同发展的结果。

Doris 跃升的第二因素,得益于其在整个 Apache 生态中的战略定位:

  1. 与 Flink 的协同:Flink 负责实时计算,Doris 负责实时分析,形成完整的实时数据处理链路
  2. 与 SeaTunnel 的集成:SeaTunnel 是一个非常简单易用的超高性能分布式数据集成平台,支持海量数据的实时同步至 Doris
  3. 与 DolphinScheduler 的结合:DolphinScheduler 作为一个分布式易扩展的可视化 DAG 任务调度系统,能够协调和管理 Doris 数据查询、导入、ETL 等任务,确保数据流程的顺畅与自动化
  4. 与多个项目的连接:与 Kafka、Pulsar 等消息队列无缝集成,与 Paimon 各种数据源深度连接...

虽然 Doris 起步相对较晚,但凭借其独特的技术优势和生态定位,迅速在这个竞争激烈的领域中占据了一席之地。

2.3 开源运营的模式创新

在过去的 4 年期间,Apache Doris 的发展历程体现了开源项目运营模式的重要性。

开源运营的模式创新.png

报告显示,Doris 增长态势迅猛。在五年内,OpenRank 指标从 894.83 飙升至 近 4000,尤其在 2021 年后呈爆发式增长。这正是飞轮科技作为 Apache Doris 社区的重要贡献者,主导运营后的时间节点,它开创了一种全新的开源运营模式:

  1. 深度参与 Apache 治理:深度参与到基金会的治理体系中,积极推动项目的标准化和国际化;
  2. 社区优先商业跟进:先把开源社区做好,让更多开发者参与进来,形成良性循环,然后再考虑商业化路径;
  3. 全球视野本土实践:既要符合 Apache 基金会的国际标准和开源文化,又要解决国内外企业的实际业务问题。

开源运营的模式创新-2.png

飞轮科技开创性地将深度参与 Apache 治理、社区优先商业跟进以及全球视野本土实践相结合,这一运营模式的创新,是 Apache Doris 在短短几年内实现爆发式增长的关键驱动力。

三、2025 COC 大会下的 Doris 真实表现

2025 COC 大会下的 Doris 真实表现.jpeg

回看 ApacheCon Asia 2025 上,一个议题格外引人注目:《Apache Doris 在 AI 领域的探索与实践》

作为一款热门的 OLAP 实时分析数据库,Apache Doris 在当前 AI 浪潮快速变革的时代背景下,已构建或正在规划更多与 AI 相关的功能及周边组件,如向量检索、MCP、RAG 等功能模块。

2025 COC 大会下的 Doris 真实表现-2.jpeg

当大家还在争论关系型数据库与 NoSQL 的优劣时,《Apache Doris 混合检索技术解析》的议题分享告诉所有人:Doris 已经在将传统全文检索(基于关键词的词典搜索)与向量检索(基于语义的搜索)相结合,提供更加精准的搜索结果。混合检索能力特别适合需要同时兼顾关键词匹配和语义理解的复杂搜索场景,如电商、内容推荐和知识库搜索。

好比一个电商平台需要同时处理 "红色连衣裙" 这样的精确关键词搜索,和 "适合约会穿的优雅服装" 这样的语义搜索。传统方案需要两套系统,而 Doris 只需要一套。

2025 COC 大会下的 Doris 真实表现-3.jpeg

在《高性能、低成本、开源可观测性,由 Apache Doris 驱动》议题中,则体现了 Apache Doris 构建的高性能、低成本开源可观测性方案,其成本效率较 ElasticSearch 提升 5 倍,并兼容 OpenTelemetry 等开源标准。

更重要的是,Doris 的生态建设不是孤军奋战,而是产业协同。

菜鸟、中国电信翼支付、小米、中国联通等头部企业的深度参与,形成了产业级的正向循环。

当一个开源项目获得了产业级应用的验证,它的成功就不再依赖于技术本身,而是建立在商业价值的坚实基础之上。让我们看看 ApacheCon Asia 2025 分享中的头部企业是如何使用 Doris 的:

2025 COC 大会下的 Doris 真实表现-4.png

  1. 《Apache Doris 在菜鸟大规模业务场景中的实施实践》:Apache Doris 在菜鸟已经有 25 + 集群,遍布 3 个地域(已具备全球化多地域部署能力),日常上万核的规模,整个迁移过程,未发生一起线上故障。从早期的验证探索到逐步在核心业务场景中落地实施,并经历了双十一促销高峰的考验。目前,Doris 是菜鸟网络 OLAP 的首选方案。
  2. 《基于 Apache Doris 在中国电信翼支付的数据安全分析实践〉:中国电信翼支付基于 Doris 构建数据安全分析平台,实现了统一日志分析与审计、用户安全画像与恶意行为检测。在金融级安全要求下,Doris 的可靠性和性能,为整个行业树立了标杆。
  3. 《小米基于 Paimon 的 Apache Doris 优化与实践》:小米基于 Paimon 的 Doris 优化实践,实现了查询性能 5 倍提升。这种深度的技术融合,展现了 Doris 架构的开放性和扩展性。
  4. 《Apache Doris 在中国联通数字智能公司可信数据空间中的实践》:中国联通基于 Apache Doris 构建可信数据空间中的数据沙箱底层存储,实现数据资源的管控,并确保数据 "可用而不可见"。并结合 Doris 联邦查询能力在数据空间内数据处理和分析中的应用,通过统一存储为指标和标签创建高效的空间服务。

这些真实的案例告诉我们一个重要趋势:Doris 正在从一个优秀的 Apache 顶级项目,演变成一个企业级的核心底座。

四、结语

ApacheCon Asia 2025 的成功举办,《中国开源年度报告》的权威发布,Apache Doris 的强势登顶,这些标志性事件汇聚在一起,构成了中国开源发展史上的一个重要节点。

Apache Doris 的跃升,不是一个孤立的技术现象,而是中国开源力量崛起的缩影:从开源的技术积累,到飞轮科技的运营创新;从 Apache 基金会的国际平台,到中国市场的实际需求;从开源社区的协作文化,到商业化的价值实现。

这正是属于我们这代人的开源使命,也是 "Apache Doris 第一" 给我们的最大启示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/92686.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/92686.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/92686.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pytest中实现自动生成测试用例脚本代码

🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快在Python的测试框架中,我们通常会针对某个系统进行测试用例的维护,在对庞大系统进行用例维护时,往往会发现很多测试用例是差不多…

一周学会Matplotlib3 Python 数据可视化-标注 (Annotations)

锋哥原创的Matplotlib3 Python数据可视化视频教程: 2026版 Matplotlib3 Python 数据可视化 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 课程介绍 本课程讲解利用python进行数据可视化 科研绘图-Matplotlib,学习Matplotlib图形参数基本设置&…

安全合规1--实验:ARP欺骗、mac洪水攻击、ICMP攻击、TCP SYN Flood攻击

一、实验环境 (思科的云实验平台)攻击机:Kali Linux(IP:192.168.234.128,MAC:00:00:29:35:64:EC)目标1:网关(IP:192.168.234.2,MAC:00:50:56:ED:D…

Linux下GCC的C++实现Hive到Snowflake数据迁移

程序结构 ├── main.cpp ├── config.json ├── hive_export/ ├── parquet_data/ ├── sql_scripts/ └── logs/核心代码实现 (main.cpp) #include <iostream> #include <fstream> #include <vector> #include <thread> #include <mut…

drippingblues靶机教程

一、信息搜集首先将其在VirtualBOX中安装&#xff0c;并将kali与靶机都设置为桥接模式紧接着我们扫描IP&#xff0c;来发现靶机地址&#xff0c;经过搜集&#xff0c;发现IP是192.168.1.9&#xff0c;我们去访问一下紧接着我们扫一下开放了哪些端口。发现开放了21、22以及80端口…

39.【.NET8 实战--孢子记账--从单体到微服务--转向微服务】--扩展功能--调整发布脚本

这篇文章&#xff0c;我们要调整发布脚本。之所以要调整发布脚本&#xff0c;是因为现在我们的项目有三个环境&#xff1a;本地&#xff08;Local&#xff09;、开发&#xff08;Development&#xff09;、生产&#xff08;Production&#xff09;。Tip&#xff1a;我们的项目虽…

商品、股指及ETF期权五档盘口Tick级与分钟级历史行情数据多维解析

在金融数据分析领域&#xff0c;本地CSV文件是存储高频与低频数据的常用载体。本文以期权市场数据为例&#xff0c;探讨如何基于CSV格式处理分钟级行情、高频Tick数据、日频数据、逐笔委托记录、五档订单簿及历史行情数据&#xff0c;并提供专业的技术实现方案。以下将从数据预…

云端软件工程智能代理:任务委托与自动化实践全解

云端软件工程智能代理&#xff1a;任务委托与自动化实践全解 背景与未来趋势 随着软件工程复杂度不断提升&#xff0c;开发者对自动化工具的依赖也日益增强。我们正进入一个“人机协作”的新时代&#xff0c;开发者可以专注于核心创新&#xff0c;将重复性、繁琐的任务委托给智…

making stb style lib(1): do color print in console

col.h: see origin repo // origin repo: https://github.com/resyfer/libcol #ifndef _COL_HOL_H_ #define _COL_HOL_H_#include <stdlib.h> #include <stdio.h> #include <stdbool.h> #include <string.h> #include <math.h> // 新增&#xf…

llm本地部署+web访问+交互

要实现基于llm的web访问和交互&#xff0c;需支持对llm的访问和对网络搜索的调用。 这里使用ollama llm兼容openai sdk访问&#xff1b;使用proxyless-llm-websearch模拟网络搜索。 1 ollama本地部署 假设ollama已经部署&#xff0c;具体过程参考 在mac m1基于ollama运行dee…

自动驾驶数据闭环

自动驾驶的数据闭环是支撑算法持续迭代的核心机制&#xff0c;其本质是通过“数据采集-处理-训练-部署-反馈”的循环&#xff0c;不断优化模型对复杂场景的适应性。由于自动驾驶数据量极大&#xff08;单车日均TB级&#xff09;、场景多样&#xff08;从常规道路到极端边缘场景…

二十、MySQL-DQL-条件查询

DQL-条件查询代码&#xff1a; DQL-条件查询 -- 1.查询 姓名 为 杨逍 的员工 select * from tb_emp where name 杨逍; -- 2.查询 id小于等于5 的员工信息 select * from tb_emp where id < 5; -- 3.查询 没有分配职位 的员工信息 select * from tb_emp where job is null; …

Mac下安装Conda虚拟环境管理器

Conda 是一个开源的包、环境管理器&#xff0c;可以用于在同一个机器上创建不同的虚拟环境&#xff0c;安装不同Python 版本的软件包及其依赖&#xff0c;并能够在不同的虚拟环境之间切换 Conda常通过安装Anaconda/Miniconda来进行使用。一般使用Miniconda就够了。Miniconda 是…

Android 中解决 Button 按钮背景色设置无效的问题

1、问题描述 在布局文件中有两个 Button 按钮&#xff0c;为每个按钮设置不同的背景色&#xff0c;但是显示出来的效果都是紫色的&#xff0c;跟设置的颜色不同&#xff0c;布局文件如下所示&#xff1a;<Buttonandroid:id"id/button_cancel"android:layout_width…

云服务器--阿里云OSS(2)【Springboot使用阿里云OSS】

&#x1f4d2; 阿里云 OSS Spring Boot 异步任务&#xff08;直接存 OSS&#xff09; 1. 项目结构 src/main/java/com/example/demo├── controller│ └── UploadController.java // 接收上传请求├── service│ ├── AsyncUploadService.java // 异步上传…

get请求中文字符参数乱码问题

第一种方法 服务器默认的传参编码格式是ISO8859-1,所以前端直接原样字符串请求&#xff0c;到后端解析一下就得到正确字符 String fileName request.getParameter("fileName"); fileName new String(fileName.getBytes("ISO8859-1"),"UTF-8");…

C语言(10)——结构体、联合体、枚举

关于C语言零基础学习知识&#xff0c;小编有话说&#xff0c;各位看官敬请入下面的专栏世界&#xff1a;打怪升级之路——C语言之路_ankleless的博客-CSDN博客 Hi&#xff01;冒险者&#x1f60e;&#xff0c;欢迎闯入 C 语言的奇幻异世界&#x1f30c;&#xff01; 我是 Ankle…

海康威视摄像头实时推流到阿里云公网服务器(Windows + FFmpeg + nginx-rtmp)

海康威视摄像头实时推流到阿里云公网服务器&#xff08;Windows FFmpeg nginx-rtmp1. 步骤总览2. 阿里云 ECS&#xff08;Linux&#xff09;配置2.1 开放端口2.2 安装 nginx-rtmp3. Windows 电脑端配置3.1 安装 FFmpeg3.1.1 官网/镜像下载&#xff1a;3.1.2 解压后将 bin 目录…

基础网络网路层——IPV4地址

在IP网络上&#xff0c;如果用户要将一台计算机连接到Internet上&#xff0c;就需要向因特网服务提供方ISP&#xff08;Internet Service Provider&#xff09;申请一个IP地址。IP地址是在计算机网络中被用来唯一标识一台设备的一组数字。IPv4地址由32位二进制数值组成&#xf…

技术速递|GPT-5 正式上线 Azure AI Foundry

AI 应用正在经历一场深刻变革——对企业来说&#xff0c;仅仅“能聊天”早已不够&#xff0c;生成内容、逻辑推理、落地生产&#xff0c;这些才是新时代对 AI 能力的真正考验。 今天&#xff0c;我们非常激动地宣布&#xff0c;OpenAI 最新旗舰大模型 GPT-5 正式上线 Azure AI …