一、客户背景与业务挑战

1.1 客户介绍

鹰角网络(HYPERGRYPH) 成立于2017年,总部位于上海,是中国知名游戏研发与发行公司,代表产品包括现象级手游《明日方舟》及《泡姆泡姆》《来自星辰》《终末地》等。公司依托阿里云构建数据平台,支撑游戏运营、社区生态及用户行为分析等核心业务,数据规模与实时性需求持续增长。

1.2 业务特征

  • 目前实时业务主要涉及日志分析,广告归因,社区运营,审核等
    • 账号日志分析:涉及用户注册、登录、订单等明细数据的查询。
    • 广告归因:探查用户的新增和回流是否由某条广告导致。
    • 社区运营:实时流水、新增活跃等统计信息。
    • 审核:黑产、账号封禁等数据分析。

1.3 原有架构痛点

原有架构是基于ClickHouse构建的实时数仓,存在以下瓶颈:

  1. 运维复杂度高:动态扩缩容操作繁琐,集群稳定性受负载波动影响显著;
  2. 导入性能不足:高频实时写入场景下吞吐量受限,难以支撑高QPS需求;
  3. 数据一致性风险:分布式表缺乏事务保证,查询可能因节点延迟导致结果偏差;
  4. 计算模型局限:Scatter-Gather架构不支持Shuffle Join等复杂查询操作;
  5. 元数据稳定性差:ZooKeeper维护的元数据在高负载下易引发服务抖动。

二、技术方案设计

2.1 方案目标

构建高性能、高弹性、易运维的实时分析平台,需要满足以下业务诉求:

  • 实时性:毫秒级查询响应与秒级数据写入
  • 弹性扩展:动态适配业务流量波动(如游戏开服、活动峰值)
  • 稳定性:消除集群负载抖动与数据一致性风险
  • 兼容性:无缝衔接现有工具链与开发习惯

2.2 架构设计

整体架构图

实时数仓架构
  1. OLTP 源库
    • MySQL 等业务数据库,产生行级变更。
  2. Extract(采集)
    • Debezium / Kafka-Connect 做 CDC,把 Binlog 转为 事件流。
    • 写入 Kafka,完成缓冲与解耦。
  3. Transform(实时计算)
    • Flink 从 Kafka 读取,进行清洗、JOIN、聚合,生成事实/维度结果流。
  4. Load & Query(StarRocks)
    • StarRocks 负责列式存储 + 高并发 OLAP 查询,直接服务 BI、报表、自动查询工具和 API

三、迁移成效与价值

3.1 技术层面

  • 性能提升
    • 核心查询响应时间缩短30%以上,复杂广告归因分析从分钟级降至秒级;
    • 高峰期QPS承载能力提升5倍,支撑夏活活动期间百万级并发请求;
  • 稳定性增强
    • 集群负载波动率降低40%,彻底解决ClickHouse的节点延迟问题;
    • 99.99% SLA保障,故障恢复时间(MTTR)缩短至分钟级;
  • 运维效率
    • 无感扩缩容操作,开服期间资源伸缩成功率100%;
    • 自动化监控覆盖主要异常场景,人工干预减少70%。

3.2 财务层面

  • 成本优化
    • 相比ClickHouse集群,同等负载下硬件成本下降22%,CU单价性价比提升显著;
    • Serverless模式按需付费,避免资源闲置浪费。

3.3 业务层面

  • 开发效率提升
    • MySQL协议兼容性减少适配成本,SQL语法更贴近业务直觉;
    • 内置函数库覆盖90%业务场景,UDF开发效率提升50%;
  • 生态适配性
    • 开源社区活跃度高,相比于原有的Clickhouse,StarRocks对于关键Bug修复与新特性迭代周期缩短。

四、未来规划

  1. 存算分离架构:探索迁移至存算分离实例,降低冷热数据存储成本;欢迎使用存算分
    离版实例
  2. 权限管理强化:引入Ranger实现细粒度访问控制,满足合规要求;
  3. 多模态分析:逐步迁移原有ElasticSearch业务,整合全文检索与结构化查询能力。

五、总结

通过与阿里云EMR Serverless StarRocks的深度合作,鹰角网络成功构建了兼具高性能、高弹性、易运维的实时分析平台,为游戏业务的精细化运营与用户洞察提供了坚实支撑。未来,双方将持续探索技术边界,推动实时数据价值释放,助力企业在游戏行业竞争中保持技术领先优势。

相关文档:
1. 迁移ClickHouse数据到StarRocks的最佳实践 

2. 基于EMR Serverless StarRocks构建分钟级准实时分析

3. 快速使用EMR Serverless StarRocks 存算分离版实例

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/96545.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/96545.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/96545.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LWIP的IP 协议栈

IP 协议栈 下面的分析把上文对 IPv4 概念的说明与 lwIP 中的具体实现代码对应起来,便于将理论与实现对照理解。分析覆盖:输入处理、路由与转发、输出与报文构建、分片/重组、校验和与各种配置点(hook、选项、统计等)。目录&#x…

高并发短信网关平台建设方案概述

本方案涵盖了架构设计、技术选型、核心功能、高可用保障以及实施路径,旨在构建一个能够应对千万级日吞吐量、稳定、安全、可扩展的现代短信网关平台。 高并发短信网关平台建设方案 一、 项目概述与目标 1.1 项目背景 为满足公司业务(如用户注册、登录、交易验证、营销通知…

阿里云服务-开启对象存储服务及获取AccessKey教程

(1)阿里云OSS简介 (2)打开阿里云网址:阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台 点击“立即开通” (2)开通成功后,充值任意金额 顶栏选择“费用”|“充值…

[特殊字符] 高可用高并发微服务架构设计:Nginx 与 API Gateway 的协同实践

一、Nginx 和 Gateway 的关系:是替代还是协作? 不是替代关系,而是协作关系。 1. Nginx 的角色(通常在最外层) 反向代理 & 负载均衡:将前端请求分发到多个后端服务或网关实例。 静态资源服务&#xf…

解码LLM量化:深入剖析最常见8位与4位核心算法

解码LLM量化:深入剖析8位与4位核心算法 大型语言模型(LLM)的性能日益强大,但其庞大的体积和高昂的计算成本构成了部署的主要障碍。模型量化,作为一种将高精度浮点权重(如16位)映射到低位宽整数&…

提问:温度不改变 logits 与概率的排名,为何还会影响模型输出?

你此前围绕温度的核心困惑始终是:“温度不改变 logits 与概率的排名,为何还会影响模型输出?” 以下总结将紧扣这一困惑,并重点补充核采样(Top-p)在其中的作用,明确温度与核采样如何共同影响输出…

【文献阅读】Lossless data compression by large models

1. 中华人工智能研究中心,郑州。 2. 鹏程实验室,深圳。 3. 上海数学与交叉学科研究所,上海。 4. 中国科学院计算技术研究所,北京。 5. 宁波人工智能产业研究所,宁波。 6. 滑铁卢大学计算机科学学院,加拿大安…

注意力机制:捕获长距离依赖关系的革命性技术

本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术! ✨ 1. 注意力机制概述:为什么需要关注"长距离依赖&qu…

PHP如何使用JpGraph生成柱形图?

PHP使用JpGraph库生成各类统计图形具有显著优势,该库作为专业的PHP图表生成工具,能够高效创建包括折线图、饼图、散点图在内的多种数据可视化图形,其核心价值在于提供了丰富的图形定制能力和简洁的API接口。JpGraph通过纯PHP实现,…

免费的端口映射工具 ChmlFrp

免费的端口映射工具 ChmlFrp 前言:之前我写过一篇关于cloudflare tunnel的使用教程,ChmlFrp是一个类似的工具,也可以用来进行内网穿透 我的博客对应文章地址 1.注册账号 注册地址 点击这个链接前往官网注册一个账号,过程简单&…

遥感领域解决方案丨涵盖:高光谱、无人机多光谱、空天地数据识别与计算

一:AI智慧高光谱遥感实战:手撕99个案例项目、全覆盖技术链与应用场景一站式提升方案在遥感技术飞速发展的今天,高光谱数据以其独特的光谱分辨率成为环境监测、精准农业、地质勘探等领域的核心数据源。然而,海量的波段数据、复杂的…

中科米堆CASAIM自动化三维测量设备测量汽车壳体直径尺寸

随着新能源汽车产业向轻量化与高集成度发展,壳体作为电池组和电驱系统的核心承载部件,其孔位加工精度直接影响装配密封性及结构强度,传统人工测量方式已难以满足现代化生产需求。自动化三维测量设备的引入,为汽车壳体直径尺寸测量…

08.21总结

圆方树 引入 我们注意到,树结构相比普通图具有诸多优良特性。若能将在无向图上求解的问题转化为树结构问题,往往能大幅简化求解过程。圆方树正是实现这一转化的有效工具。 定义 我们称原图中的点为"圆点"。通过引入方点并调整边的关系&#xf…

亚马逊广告优化新逻辑:从人工苦力到AI智能的进化之路

"为什么我的广告花费越来越高,转化却越来越差?""如何在海量关键词中找到真正能带来转化的黄金词?""为什么手动调整出价总是跟不上流量变化的速度?""怎样才能避免因库存问题导致的广告权重暴跌…

【51单片机】【protues仿真】基于51单片机水位监测系统

目录 一、主要功能 二、使用步骤 三、硬件资源 四、软件设计 五、实验现象 一、主要功能 1、数码管显示当前水位值 2、按键设置水位上下限阈值 3、当水位低于下限,启动蜂鸣器警报并抽水至水位上限停止抽水 4、电机模拟水泵,蜂鸣器,指示…

白名单过滤的文件上传如何bypass:boot2root靶机之fristileaks

靶机提示 base64解码提取图片 文件上传之apache多后缀名解析漏洞 linpeas dirtycow提权 靶机下载 通过网盘分享的文件:FristiLeaks_1.3.ova 链接: https://pan.baidu.com/s/1ZWznp8egNGwnQqwh1gkSZg?pwdwwvp 提取码: wwvp --来自百度网盘超级会员v8的分享主…

Centos 8 管理防火墙

firewall-cmd 检查与安装 在 CentOS 8 上安装和启用 firewalld(提供 firewall-cmd 工具)的步骤如下:1. 检查 **firewalld** 是否已安装 在安装前,先检查系统中是否已安装: sudo firewall-cmd --version如果返回版本号&…

使用PPT进行科研绘图过程中常用的快捷键

PPT科研绘图常用快捷键速查表功能类别快捷键功能描述基础操作与选择Ctrl A全选幻灯片上的所有对象。Ctrl D快速复制选中的对象,并自动保持等间距排列。Shift Click多选多个对象。Ctrl G将选中的多个对象组合成一个整体。Ctrl Shift G取消组合。Ctrl 拖动复制…

`strchr` 字符串查找函数

1) 函数的概念与用途 strchr 是 C 标准库中的一个基础但极其重要的字符串处理函数,它的名字来源于"string chracter"(字符串字符)。这个函数的功能非常明确:在字符串中查找特定字符的第一次出现位置。 可以将 strchr 想…

Redis 678

Redis 8 是当前的最新稳定版(截至 2024 年中),它在 Redis 7 的基础上带来了更多重要改进。我们来对这三个主要版本进行一次全面的功能和性能对比。 核心演进脉络 Redis 6 (2020):多线程时代的开创者。解决了网络 I/O 瓶颈&#xf…