一、什么是缓存

缓存(cache)是计算机中的一个经典的概念,在很多场景中都会涉及到。核心思路就是把一些常用的数据放到触手可及(访问速度更快)的地方,方便随时读取。

举例:我需要去高铁站坐高铁,坐高铁是需要反复刷身份证的(进入高铁站、检票、上车、乘车过程中、出站...)。正常来说,我的身份证是放在行李箱里的(行李箱的存储空间大,足够能装),但是每次刷身份证都需要开一次行李箱找身份证就非常不方便。因此我就可以把身份证先放到口袋里,虽然口袋空间小,但是访问速度比行李箱快很多。这样的话每次刷身份证我只需要从口袋里掏身份证就行了,就不必打开行李箱了。此时 “口袋” 就是 “皮箱” 的缓存,使用缓存能够大大提高访问效率。

这里所说的 “触手可及” 是个相对的概念。对于硬件的访问速度来说,通常情况下:CPU 寄存器 > 内存 > 硬盘 > 网络。那么硬盘相对于网络来说是 “触手可及的”,就可以使用硬盘作为网络的缓存。内存相对于硬盘是 “触手可及的”,就可以使用内存作为硬盘的缓存。CPU 寄存器相对于内存是 “触手可及的”,就可以使用 CPU 寄存器作为内存的缓存。

对于计算机硬件来说,往往访问速度越快的设备成本越高,存储空间越小。缓存是更快,但是空间上往往是不足的,因此大部分的时候,缓存只放一些热点数据(访问频繁的数据),就非常有用

关于 “二八定律”:20% 的热点数据能够应对 80% 的访问场景。因此只需要把这少量的热点数据缓存起来,就可以应对大多数场景,从而在整体上有明显的性能提升。

二、使用 Redis 作为缓存

在一个网站中,经常会使用关系型数据库(比如 MySQL)来存储数据。关系型数据库虽然功能强大,但是有一个很大的缺陷:性能不高(换而言之,进行一次查询操作消耗的系统资源较多)。

为什么说关系型数据库性能不高?

  1. 数据库把数据存储在硬盘上,硬盘的 IO 速度并不快,尤其是随机访问。
  2. 如果查询不能命中索引,就需要进行表的遍历,这就会大大增加硬盘 IO 次数。
  3. 关系型数据库对于 SQL 的执行会做一系列的解析、校验、优化工作。
  4. 如果是⼀些复杂查询,比如联合查询,需要进行笛卡尔积操作,效率更是降低很多。

因此,如果访问数据库的并发量比较高,对于数据库的压力是很大的,很容易就会使数据库服务器宕机。

为什么并发量高了就会宕机?

服务器每次处理一个请求,都是需要消耗一定的硬件资源的。所谓的硬件资源包括不限于 CPU、内存、硬盘、网络带宽... ... ⼀个服务器的硬件资源本身是有限的,一个请求消耗一份资源,请求多了自然把资源就耗尽了。后续的请求没有资源可用,自然就无法正确处理,更严重的还会导致服务器程序的代码出现崩溃。

如何让数据库能够承担更大的并发量呢?

核心思路主要是两个:

  • 开源:引入更多的机器,部署更多的数据库实例,构成数据库集群(主从复制、分库分表等...)。
  • 节流:引入缓存,使用其他的方式保存经常访问的热点数据,从而降低直接访问数据库的请求数量。

实际开发中,这两种方案往往是会搭配使用的。

Redis 就是一个用来作为数据库缓存的常见方案

Redis 访问速度比 MySQL 快很多,或者说处理同⼀个访问请求,Redis 消耗的系统资源比 MySQL 少很多,因此 Redis 能支持的并发量更大。

  • Redis 数据在内存中,访问内存比硬盘快很多。
  • Redis 只是支持简单的 key-value 存储,不涉及复杂查询的那么多限制规则。

  • 客户端访问业务服务器,发起查询请求。
  • 业务服务器先查询 Redis,看想要的数据是否在 Redis 中存在。
  1. 如果已经在 Redis 中存在了就直接返回,此时不必访问 MySQL 了。
  2. 如果在 Redis 中不存在,再查询 MySQL。

注意缓存是用来加快 “读操作” 的速度的,如果是 “写操作”,还是要老老实实写数据库,缓存并不能提高性能。

三、缓存的更新策略

到底哪些数据才是 “热点数据” 呢?

1、定期生成

每隔一定的周期(比如一天 / 一周 / 一个月),对于访问的数据频次进行统计,挑选出访问频次最高的前 N% 的数据。

以搜索引擎为例:用户在搜索引擎中会输入一个 “查询词”,有些词是属于高频的,大家都爱搜(鲜花、蛋糕、交友...),有些词就属于低频的,大家很少搜。

搜索引擎的服务器会把哪个用户在什么时间搜了什么词,都通过日志的方式记录的明明白白,然后每隔一段时间对这期间的搜索结果进行统计

上面这种做法实时性较低,对于一些突然情况应对的并不好。比如春节期间,“春晚” 这样的词就会成为非常高频的词,而平时则很少会有人搜索 “春晚”。

2、实时生成

先给缓存设定容量上限(可以通过 Redis 配置文件的 maxmemory 参数设定),接下来把用户每次查询:

  • 如果在 Redis 查到了,就直接返回。
  • 如果 Redis 中不存在,就从数据库查,把查到的结果同时也写入 Redis。(经过一段时间的 “动态平衡”,redis 中的 key 就逐渐成了热点数据)

如果缓存已经满了(达到上限),就触发缓存淘汰策略,把⼀些 “相对不那么热门” 的数据淘汰掉。按照上述过程持续一段时间之后 Redis 内部的数据自然就是 “热门数据” 了。

通用的淘汰策略主要有以下几种:

下列策略并非局限于 Redis,其他缓存也可以按这些策略展开。

  1. 把缓存中存在时间最久的(也就是先来的数据)淘汰掉。
  2. 记录每个 key 的最近访问时间,把最近访问时间最⽼的 key 淘汰掉。
  3. 记录每个 key 最近⼀段时间的访问次数,把访问次数最少的淘汰掉。
  4. 从所有的 key 中抽取幸运儿被随机淘汰掉。

四、缓存预热、缓存穿透、缓存雪崩和缓存击穿

1、关于缓存预热(Cache preheating)

(1)什么是缓存预热

使用 Redis 作为 MySQL 的缓存的时候,当 Redis 刚刚启动或者 Redis 大批 key 失效之后,此时由于 Redis 服务器是没有什么缓存数据的,那么所有的请求就会打给 MySQL,MySQL 就可能直接被访问到,从而造成较大的压力。随着时间的推移,redis 上的数据积累的越来越多,MySQL 承担的压力也就越来越小。因此就需要提前把热点数据准备好,直接写入到 Redis 中,使 Redis 可以尽快为 MySQL 撑起保护伞。

热点数据可以基于之前介绍的统计的方式生成即可。这份热点数据不一定非得那么 “准确”,只要能帮助 MySQL 抵挡大部分请求即可。随着程序运行的推移,缓存的热点数据会逐渐自动调整,来更适应当前情况。 

2、关于缓存穿透(Cache penetration)

(1)什么是缓存穿透

访问的 key 在 Redis 和 数据库中都不存在,此时这样的 key 不会被放到缓存上,后续如果仍然在访问该 key,依然会访问到数据库,这就会导致数据库承担的请求太多,压力很大。这种情况称为缓存穿透

(2)为什么会产生缓存穿透
  • 业务设计不合理。比如缺少必要的参数校验环节,导致非法的 key 也被进行查询了。
  • 开发 / 运维误操作。不小新把部分数据从数据库上误删了。
  • 黑客恶意攻击。
(3)如何解决缓存穿透
  1. 针对要查询的参数进行严格的合法性校验,比如要查询的 key 是用户的手机号,那么就需要校验当前 key 是否满足⼀个合法的手机号的格式。
  2. 针对数据库上也不存在的 key , 也存储到 Redis 中,比如 value 就随便设成⼀个 "",避免后续频繁访问数据库。
  3. 使用布隆过滤器先判定 key 是否存在,再真正查询。 

3、关于缓存雪崩(Cache avalanche)

(1)什么是缓存雪崩

短时间内大量的 key 在缓存上失效,导致数据库压力骤增,甚至直接宕机。本来 Redis 是 MySQL 的一个护盾,帮 MySQL 抵挡了很多外部的压力。一旦护盾突然失效了,MySQL 自身承担的压力骤增,就可能直接崩溃。

(2)为什么会产生缓存雪崩

大规模 key 失效,其可能性主要有两种:

  1. Redis 挂了。
  2. Redis 上的大量的 key 同时过期。
为什么会出现大量的 key 同时过期?

这种和可能是短时间内在 Redis 上缓存了大量的 key,并且设定了相同的过期时间。

(3)如何解决缓存雪崩
  • 部署高可用的 Redis 集群,并且完善监控报警体系。
  • 不给 key 设置过期时间或者设置过期时间的时候添加随机时间因子。 

4、关于缓存击穿(Cache breakdown)

(1)什么是缓存击穿

此处把 breakdown 翻译成 “击穿”,我以为并非是⼀个好的选择,容易和缓存穿透混淆,翻译成 “瘫痪” / “崩溃” 也许更合适一些。

相当于缓存雪崩的特殊情况,针对热点 key,突然过期了,导致大量的请求直接访问到数据库上,甚至引起数据库宕机。

(2)如何解决缓存击穿
  • 基于统计的方式发现热点 key,并设置永不过期。
  • 进行必要的服务降级。例如访问数据库的时候使用分布式锁,限制同时请求数据库的并发数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/920338.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/920338.shtml
英文地址,请注明出处:http://en.pswp.cn/news/920338.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RK3588 Ubuntu22.04 解决eth0未托管问题

在调试rk3588的Ubuntu的时候发现,网络那里一直显示eth0未托管,但是联网功能又是正常的,猜测是某一个配置文件的问题修改如下:打开/etc/NetworkManager/NetworkManager.conf,将managed,修改成true即可然后重…

雷卯针对香橙派Orange Pi 3G-IoT-B开发板防雷防静电方案

一、应用场景计算机、无线网络服务器、游戏机、音乐播放器、高清视频播放器、扬声器、Android 设备、Scratch 编程平台二、核心功能参数三、扩展接口详情雷卯专心为您解决防雷防静电的问题,有免费实验室供检测。开发板资料转自深圳迅龙软件。谢谢!

Science Robotics 丰田研究院提出通过示例引导RL的全身丰富接触操作学习方法

人类表现出非凡的能力,可以利用末端执行器(手)的灵巧性、全身参与以及与环境的交互(例如支撑)来纵各种大小和形状的物体。 人类灵活性的分类法包括精细和粗略的作技能。尽管前者(精细灵巧性)已在…

趣丸游戏招高级业务运维工程师

高级业务运维工程师趣丸游戏 广州职位描述1、负责公司AI业务线运维工作,及时响应、分析、处理问题和故障,保证业务持续稳定; 2、负责基于分布式、微服务、容器云等复杂业务的全生命周期的稳定性保障; 3、参与设计运维平台、工具、…

2025通用证书研究:方法论、岗位映射与四证对比

本文基于公开材料与典型招聘描述,对常见通用型或准入型证书做方法论级别的比较,不构成培训或报考建议,也不涉及任何招生、返现、团购等信息。全文采用统一术语与可复用模板,以减少“经验之争”,便于不同背景的读者独立…

在WSL2-Ubuntu中安装Anaconda、CUDA13.0、cuDNN9.12及PyTorch(含完整环境验证)

WSL 搭建深度学习环境,流程基本上是一样的,完整细节可参考我之前的博客: 在WSL2-Ubuntu中安装CUDA12.8、cuDNN、Anaconda、Pytorch并验证安装_cuda 12.8 pytorch版本-CSDN博客 之所以记录下来,是因为CUDA和cuDNN版本升级后&#x…

OpenFOAM中梯度场的复用(caching)和生命期管理

文章目录OpenFOAM中梯度场的复用(caching)和生命期管理一、缓存机制的目标二、如何实现缓存(以 fvc::grad 为例)1. 使用 IOobject::AUTO_WRITE 和注册名2. 示例:fvc::grad 的缓存实现(简化逻辑)三、生命期管理是如何实…

【Hot100】贪心算法

系列文章目录 【Hot100】二分查找 文章目录系列文章目录方法论Hot100 之贪心算法121. 买卖股票的最佳时机55. 跳跃游戏45. 跳跃游戏 II763. 划分字母区间方法论 Hot100 之贪心算法 121. 买卖股票的最佳时机 121. 买卖股票的最佳时机:给定一个数组 prices &#…

电子电气架构 --- 软件项目复杂性的驾驭思路

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 做到欲望极简,了解自己的真实欲望,不受外在潮流的影响,不盲从,不跟风。把自己的精力全部用在自己。一是去掉多余,凡事找规律,基础是诚信;二是…

SSE实时通信与前端联调实战

1.SSE 原理机制 sse 类似websocket,但是sse是单向的,不可逆的,只能服务端向客户端发送数据流 2.解决跨域问题 Access to XMLHttpRequest at http://127.0.0.1:8090/sse/doChat from origin http://127.0.0.1:3000 has been blocked by CORS policy: Re…

从传统到创新:用报表插件重塑数据分析平台

一、传统 BI 平台面临的挑战 在当今数字化时代,数据已成为企业决策的重要依据。传统的商业智能(BI)平台在数据处理和分析方面发挥了重要作用,但随着数据量的爆炸式增长和用户需求的日益多样化,其局限性也逐渐显现。 …

MySQL--MySQL中的DECIMAL 与 Java中的BigDecimal

1. 为什么需要 DECIMAL在数据库中,常见的数值类型有:INT、BIGINT → 整数,存储容量有限。FLOAT、DOUBLE → 浮点数,存储效率高,但存在精度丢失问题。DECIMAL(M, D) → 定点数,存储精确值。例子:…

低空无人机系统关键技术与应用前景:SmartMediaKit视频链路的基石价值

引言:低空经济的新兴格局 低空经济作为“新质生产力”的代表,正在从政策驱动、技术突破和市场需求的共振中走向产业化。2023年,中国低空经济的市场规模已超过 5000 亿元人民币,同比增长超过 30%。无人机(UAV&#xff…

在Windows系统上升级Node.js和npm

在Windows系统上升级Node.js和npm,我推荐以下几种方法: 方法1:使用官网安装包(最简单) 访问 nodejs.org 下载Windows安装包(.msi文件) 运行安装包,选择"修复"或直接安装新…

【Jetson】基于llama.cpp部署gpt-oss-20b(推理与GUI交互)

前言 本文在jetson设备上使用llama.cpp完成gpt-oss 20b的部署,包括后端推理和GUI的可视化交互。 使用的设备为orin nx 16g(super),这个显存大小推理20b的模型完全没有问题。 使用硬件如下,支持开启super模式。&#…

Matplotlib 可视化大师系列(一):plt.plot() - 绘制折线图的利刃

目录Matplotlib 可视化大师系列博客总览Matplotlib 可视化大师系列(一):plt.plot() - 绘制折线图的利刃一、 plt.plot() 是什么?二、 函数原型与核心参数核心参数详解三、 从入门到精通:代码示例示例 1:最基…

第二阶段Winfrom-8:特性和反射,加密和解密,单例模式

1_预处理指令 (1)源代码指定了程序的定义,预处理指令(preprocessor directive)指示编译器如何处理源代码。例如,在某些情况下,我们希望编译器能够忽略一部分代码,而在其他情况下&am…

【开题答辩全过程】以 微信小程序的医院挂号预约系统为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

鸿蒙ArkUI 基础篇-06-组件基础语法-Column/Row/Text

目录 掌握组件写法,使用组件布局界面 ArkUI与组件 先布局再内容 DevEco Studio代码实战 预览效果 总结 练习 掌握组件写法,使用组件布局界面 ArkUI与组件 ArkUI(方舟开发框架):构建 鸿蒙 应用 界面 的框架 组件…

8.27 网格memo

lc329计算矩阵中最长递增路径长度尝试从矩阵每个位置出发,int dfs() 往上下左右四个方向找严格递增的路径retmax(ret,dfs(x,y)1);return memo[i][j]ret;返回所有路径里的最长长度 class Solution {public:int dx[4]{0,0,1,-1};int dy[4]{1,-1,0,0};int m,n;vector&l…