Flink 实时计算 QPS 面试题

题目:
假设某互联网应用日活用户 100 万,每天产生 1 亿条数据(日志/事件),要求使用 Apache Flink 实现实时计算系统的 QPS(Queries Per Second),并考虑以下需求:

  1. 实时统计当前 QPS(每秒请求数),并输出到监控系统(如 Prometheus、Kafka、MySQL 等)。

  2. 处理数据倾斜,某些 key(如热门用户或接口)可能产生大量数据,如何优化?

  3. 保证 Exactly-Once 语义,确保 QPS 计算不丢不重。

  4. 应对高峰流量,假设瞬时 QPS 可能达到 10,000,如何保证 Flink 作业的稳定性和低延迟?

问题:

  1. 请设计 Flink 作业的数据流(Source → Transformation → Sink),并说明关键算子(如 windowkeyByaggregate)的作用。

  2. 如何实现 QPS 的滑动窗口(如每 1s 计算一次最近 10s 的 QPS)?

  3. 如果某些 key 的数据量远高于其他 key(数据倾斜),你会如何优化?

  4. 如何保证 Exactly-Once 语义?请结合 Checkpoint 和 StateBackend 说明。

  5. 如果 QPS 突增导致反压(Backpressure),你会如何调整 Flink 作业配置?


考察点

✅ Flink 核心概念:Window、KeyedStream、State、Checkpoint
✅ 性能优化:数据倾斜处理、反压调优
✅ 容错机制:Exactly-Once 实现方式
✅ 生产经验:监控、Sink 适配、资源分配


参考答案(简要版)

1. Flink 作业设计
DataStream<LogEvent> source = env.addSource(new KafkaSource<>(...)); // 从 Kafka 消费日志  
DataStream<Tuple2<String, Long>> mapped = source  .map(event -> Tuple2.of(event.getEndpoint(), 1L)) // 转换为 (endpoint, 1)  .returns(Types.TUPLE(Types.STRING, Types.LONG));  // 按接口名分组,计算每 10s 滑动窗口(每 1s 输出一次)  
DataStream<QpsResult> qpsStream = mapped  .keyBy(t -> t.f0) // 按接口分组(可能数据倾斜)  .window(SlidingProcessingTimeWindows.of(Time.seconds(10), Time.seconds(1)))  .aggregate(new QpsAggregator()) // 自定义聚合函数  .addSink(new PrometheusSink()); // 输出到监控系统  
2. 数据倾斜优化
  • 方案 1:加随机前缀,如 hot_key → hot_key_1hot_key_2,聚合后再合并。

  • 方案 2:使用 rebalance() 强制均匀分发,牺牲局部有序性。

3. Exactly-Once 保证
  • Checkpoint 机制:开启 enableCheckpointing(5000),设置 CheckpointingMode.EXACTLY_ONCE

  • StateBackend:使用 RocksDBStateBackend(大状态)或 FsStateBackend(低延迟)。

  • Sink 端:Kafka 事务 / 幂等写入(如 MySQL 用 INSERT ON DUPLICATE KEY UPDATE)。

4. 反压调优
  • 增加并行度setParallelism(4) 分散负载。

  • 调整缓冲区taskmanager.network.memory.floating-buffers-per-gate

  • 启用 RocksDB 本地 SSD:减少 State 访问延迟。


进阶问题

  • 如果 QPS 计算需要区分成功/失败请求(如 HTTP 200 vs 500),如何修改?

  • 如何用 Flink SQL 实现相同的 QPS 计算?

(面试者可选择继续深入讨论~)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/93354.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/93354.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/93354.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pytest项目_day12(yield、fixture的优先顺序)

yield yield可以用作fixture的后置操作 yield的执行位置和scope的范围设置有关 当我们将scope设置为function时&#xff0c;yield就会在方法结束时执行yield后的代码yield还可以返回数据&#xff0c;类似于return&#xff0c;不过yield之后的代码会执行&#xff0c;而return不会…

面试实战 问题三十二 Java中创建对象的几种方式

Java中创建对象的几种方式 在Java中&#xff0c;创建对象是面向对象编程的核心操作。对象创建不仅涉及直接实例化&#xff0c;还包括通过设计模式、反射机制等间接方式来实现。以下我将逐步解释Java中常见的对象创建方式&#xff0c;每种方式都基于Java语言规范和相关设计原则。…

ToDesk云电脑 vs 顺网云 vs 海马云:谁才是5090显卡云电脑的真王者?

文章目录一、引言二、产品介绍三、硬件配置对比3.1 处理器3.2 显卡四、云电脑性能实测对比4.1 网络优化4.1.1 海马云4.1.2 ToDesk云电脑4.1.3 顺网云4.2 鲁大师硬件测评4.3 3DMark4.4 系统稳定性测试4.4.1 海马云4.4.2 顺网云4.4.3 ToDesk云电脑4.5 为什么这么看重平台优化&…

.NET 在鸿蒙系统(HarmonyOS Next)上的适配探索与实践

目录 1. 前言 2. 项目状态 3. 运行时环境选择 4. NativeAOT 适配原理 4.1 底层兼容性 4.2 技术实现方案 5. 已知问题及解决方案 5.1 syscall 限制&#xff08;已解决&#xff09; 5.2 mmap 申请虚拟内存过大&#xff08;已解决&#xff09; 5.3 第三方库缺失问题&…

图像处理--图像模板匹配NCC算法-->Fast NCC算法的解读

目录 前言 一、基础知识 二、NCC基本公式以及解决问题 1. NCC基本公式 2. 基本公式解读 三、简化分母 fuv 1. 要简化的分母 2. 积分图 3. 分母拆开化简 四、简化分子 1. 要简化的分子 2. 模板函数的近似 3. 基函数简单解释 五、Fast NCC归一化互相关值 1. 最终公…

短剧小程序系统开发:赋能创作者,推动短剧艺术创新发展

短剧作为一种新兴的艺术形式&#xff0c;具有独特的魅力和发展潜力。然而&#xff0c;在传统的发展模式下&#xff0c;短剧创作者面临着诸多限制和挑战。短剧小程序系统的开发&#xff0c;为创作者提供了强大的赋能&#xff0c;推动了短剧艺术的创新发展。创作工具丰富&#xf…

Redis知识点+项目+面试八股

基础篇&#xff1a;讲解Redis常用数据结构实战篇&#xff1a;黑马点评实战高级篇&#xff1a;Redis高级知识点原理篇&#xff1a;Redis原理面试篇&#xff1a;Redis八股⭕️第一章&#xff1a;基础篇⭕️1. Redis介绍Redis是一个key-value的数据库&#xff0c;key一般是String类…

WPS文字和Word文档如何选择多个不连续的行、段

要选择Word或WPS文字中不连续的多行、多段&#xff0c;使用鼠标加键盘即可快速搞定。Word和WPS文字中选择多行的操作一样&#xff0c;选择多段的方法略有不同。选中以后&#xff0c;可以对这些内容进行删除、复制、剪切、查找、替换、设置格式等操作。一、在Word和WPS文字中选择…

嵌入式C/C++面试大全

基础语法 1.在main执⾏之前和之后执⾏的代码可能是什么&#xff1f; main函数执⾏之前&#xff0c;主要就是初始化系统相关资源&#xff1a; 设置栈指针&#xff0c;其中栈存放的局部变量、函数参数、函数调用的返回地址初始化静态 static 变量和 global 全局变量&#xff0c;即…

Java应用架构实战指南:主流模式解析与Spring落地实践

在Java开发的世界里,选对应用架构不是纸上谈兵,而是项目成败的关键。 今天,我想和大家聊聊四种主流架构模式——分层、微服务、事件驱动和六边形架构。这些模式在实战中各有千秋,我会结合代码示例和架构图,带大家看清它们的内核。无论你是新手还是老手,这篇文章都能帮你…

重学JS-002 --- JavaScript算法与数据结构(二)JavaScript 基础知识

文章目录加入jsjs 的位置控制台变量关键字DOMbutton注释CSS转义函数参数对象属性属性访问数组Math加入js 首先创建一个 script 元素。 此元素用于将 JavaScript 加载到 HTML 文件中。 <script src"./script.js"></script>js 的位置 script 标签位于 HTML…

计算机视觉--opencv(代码详细教程)(二)

一、图片的边界填充在 OpenCV 中&#xff0c;cv2.copyMakeBorder()是用于给图像添加边框&#xff08;边缘&#xff09;的核心 API&#xff0c;其完整语法和参数说明如下&#xff1a;函数完整定义cv2.copyMakeBorder(src, top, bottom, left, right, borderType, valueNone)参数…

FPGA实现Aurora 64B66B视频点对点传输,基于GTX高速收发器,提供4套工程源码和技术支持

目录 1、前言Aurora 64B66B是啥&#xff1f;官方有Example&#xff0c;为何要用你这个&#xff1f;工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 GT 高速接口解决方案本方案在Aurora 8B10B上的应用 3、工程详细设…

【软件安装|1】CentOS7最新可用国内 yum 镜像源配置和Linux版MySQL8.0安装及其相关知识

文章目录一.更换yum镜像源二.安装并配置MySQL8.0安装配置相关知识什么是yum&#xff1f;什么是镜像源&#xff1f;相关知识请看最后&#xff0c;首先来更换yum镜像源 更换前需要准备好VmwareWorkstation和Finalshell&#xff0c;开启虚拟机&#xff0c;切换到root用户 Vmware和…

【深度学习】深度学习的四个核心步骤:从房价预测看机器学习本质

文章目录基础概念与原理第一步&#xff1a;准备数据 - 构建学习的基础数据生成与特征工程&#xff08;选择对预测有用的特征&#xff09;数据集划分的重要性第二步&#xff1a;设计模型 - 建立数学表达线性回归模型的数学表达损失函数的设计哲学第三步&#xff1a;训练优化 - 自…

Java使用Apache POI读取Excel文件

一、下载jar包 Apache POI有提供下载地址&#xff1a;Apache Archive Distribution Directory&#xff0c;直接打开链接并选择所需的版本下载即可(双击last modified可按最新更新时间排序)&#xff0c;本文章以poi-bin-4.1.1-20191023.zip为例&#xff0c;进入官网下载链接后&…

VLMs开发——基于Qwen2.5-VL 实现视觉语言模型在目标检测中的层级结构与实现方法

概述 目标检测作为计算机视觉领域的核心任务&#xff0c;传统方法依赖于 YOLO 等视觉模型对预定义类别进行位置预测。然而&#xff0c;此类方法受限于预训练类别体系&#xff0c;难以实现灵活的视觉交互。视觉语言模型&#xff08;Vision-Language Models, VLMs&#xff09;的…

Spring Boot + Redis + 布隆过滤器防止缓存穿透

✅ 项目概述 在高并发系统中&#xff0c;缓存穿透 是一个经典问题&#xff1a;当恶意请求或业务逻辑查询一个数据库中不存在的 Key&#xff0c;由于缓存中也没有&#xff0c;请求会直接打到数据库&#xff0c;导致数据库压力激增&#xff0c;甚至宕机。 本项目使用 Spring Bo…

电子电路学习日记

这里的 K 表示 千欧&#xff08;kilo-ohm&#xff09;&#xff0c;而 F 在很多国产 EDA 软件&#xff08;比如立创EDA、Altium 的一些中文封装库&#xff09;里用来标注精度&#xff08;公差&#xff09;&#xff0c; F 代表 1% 精度&#xff08;英文 Fine tolerance&#xff0…

oracle 怎么实现读一致性

​ Oracle 数据块读一致性判断流程&#xff08;正确版&#xff09; 假设&#xff1a;Query SCN 查询开始的 SCN&#xff08;Query SCN&#xff09; lastSubbmit SCN 行中最新的提交scn Row SCN 行最后修改的 SCN&#xff08;存储在行头&#xff0c;通过 ITL 推导&#xff09…