在现代高性能计算和虚拟化系统中,地址转换(Address Translation)是一个至关重要的机制。随着 PCIe 设备(如 GPU、网卡、存储控制器)直接访问系统内存的能力增强,设备对虚拟内存的访问需求日益增长。

图片

为了提升性能并确保安全访问,Address Translation Services(ATS) 应运而生。

图片

ATS 是 PCIe 规范中的一项关键功能,允许设备(如 Endpoint)在访问内存时自行进行虚拟地址到物理地址的转换,而无需依赖 CPU 的 MMU(Memory Management Unit)或操作系统介入。这不仅提升了性能,也增强了设备的自主性和安全性。

图片

在早期的 PCIe 架构中,设备(如网卡或存储设备)只能通过 DMA(Direct Memory Access)访问物理地址。这意味着设备必须依赖主机(Host)为它分配物理地址,或者由操作系统进行地址映射。

图片

这种方式存在以下问题:

  • 性能瓶颈

    :每次地址转换都需要主机介入,导致延迟增加。

  • 虚拟化支持差

    :在虚拟化环境中,多个虚拟机共享同一个物理设备,传统的物理地址访问方式难以满足隔离和安全需求。

  • 资源浪费

    :需要为每个虚拟机预留连续的物理内存区域。

扩展阅读:

浅析CXL P2P DMA加速数据传输的原理

PCIe P2P DMA全景解读

深度剖析:DMA对PCIe数据传输性能的影响

《存储IO路径》专题:数据魔法师DMA

为了解决上述问题,PCIe 3.0 引入了 Address Translation Services(ATS)。ATS 允许设备在访问内存时,使用虚拟地址,并通过 IOMMU(Input/Output Memory Management Unit)进行地址转换。设备可以缓存转换结果(ATC,Address Translation Cache),从而减少频繁的转换请求,提高性能。

图片

ATS 的实现依赖于以下关键组件:

组件

描述

IOMMU

输入/输出内存管理单元,负责将设备的虚拟地址转换为物理地址。

MMU

CPU 的内存管理单元,负责将 CPU 的虚拟地址转换为物理地址。

Translation Agent (TA)

负责处理 ATS 转换请求的实体,可以是 IOMMU 或 MMU。

Address Translation Cache (ATC)

设备内部缓存地址转换结果的结构,类似于 CPU 的 TLB。

Address Translation Protection Table (ATPT)

存储地址转换信息的数据结构,由 TA 使用。

图片

设备发起转换请求(Translation Request): 设备(如 Endpoint)向 Root Complex(RC)发送 ATS Translation Request,请求将虚拟地址转换为物理地址。请求中包含虚拟地址、PASID(Process Address Space Identifier)、访问权限等信息。

图片

Root Complex 转发请求至 Translation A

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/90525.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/90525.shtml
英文地址,请注明出处:http://en.pswp.cn/web/90525.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【前端】ikun-pptx编辑器前瞻问题二: pptx的压缩包结构,以及xml正文树及对应元素介绍

文章目录PPTX文件本质:一个压缩包核心文件解析1. 幻灯片内容文件 (ppt/slides/slideX.xml)2. 元素类型解析文本框元素 (p:sp)图片元素 (p:pic)单位系统开发注意事项参考工具pptx渲染路线图PPTX文件本质:一个压缩包 PPTX文件实际上是一个遵循Open XML标准…

分布式任务调度实战:XXL-JOB与Elastic-Job深度解析

告别传统定时任务的局限,拥抱分布式调度的强大与灵活 在现代分布式系统中,高效可靠的任务调度已成为系统架构的核心需求。面对传统方案(如Timer、Quartz)在分布式环境下的不足,开发者急需支持集群调度、故障转移和可视…

Windows 11下纯软件模拟虚拟机的设备模拟与虚拟化(仅终端和网络)

Windows 11下用GCC的C代码实现的虚拟机需要终端输入/输出(如串口或虚拟控制台)和网络连接,但不需要完整的硬件设备(如磁盘、显卡、USB 等)。在终端输入/输出方面,参考qemu的源代码,但不调用qemu…

CCF-GESP 等级考试 2025年6月认证Python六级真题解析

1 单选题(每题 2 分,共 30 分)第1题 下列哪一项不是面向对象编程(OOP)的基本特征?( )A. 继承 (Inheritance) B. 封装 (Encapsul…

C++中的deque

1. 什么是 Deque? 核心概念: Deque 是 “Double-Ended Queue”(双端队列)的缩写。你可以把它想象成一个可以在两端(头部和尾部)高效地进行添加或删除操作的线性数据结构。关键特性: 双端操作&am…

GNU到底是什么,与Unix和Linux是什么关系

GNU(发音为 /ɡnuː/,类似“革奴”)是一个自由软件操作系统项目,由理查德斯托曼(Richard Stallman)于1983年发起,目标是创建一个完全由自由软件组成的类Unix操作系统。它的名字是一个递归缩写&a…

双指针算法介绍及使用(下)

在上一篇文章中我们已经对双指针有了一定了解,接下来我们通过题目来对双指针进行更好的理解。 1. leetcode 202. 快乐数 这道题使用的方法是快慢指针, 比如说一个数X,那么创建两个变量X1和X2,然后X1每次变化两次,X2变化…

Elasticsearch整合:Repository+RestClient双模式查询优化

Elasticsearch整合:RepositoryRestClient双模式查询优化Elasticsearch 双模式查询优化:Repository RestClient 整合指南一、架构设计:双模式协同工作流二、Repository 模式:快速开发最佳实践2.1 基础配置2.2 高级特性&#xff1a…

Elasticsearch 高级查询语法 Query DSL 实战指南

目录 1、DSL 概述 1.1 DSL按照查询的结构层次划分 1.2 DSL按照检索功能的用途和特性划分 1.3 示例数据准备 2、match_all ——匹配所有文档 3、精确匹配 3.1 term——单字段精确匹配查询 3.2 terms——多值精确匹配 3.3 range——范围查询 3.4 exists——是否存在查询…

DNS 服务正反向解析与 Web 集成实战:从配置到验证全流程

DNS 服务正反向解析配置全流程指南 一、前言 在网络环境中,DNS(Domain Name System)服务起着至关重要的作用,它负责将域名解析为 IP 地址,以及将 IP 地址反向解析为域名。本文将详细介绍如何配置 DNS 服务的正反向解析…

2025.07.25【宏基因组】|PathoScope 安装与使用指南

PathoScope 安装与使用指南:微生物组数据分析利器 作为一名生物信息工程师,在微生物组数据分析中,我们常常需要高效、准确的工具来鉴定和量化样本中的微生物组成。PathoScope 正是这样一款强大的工具,它能够帮助我们从高通量测序…

AI结对编程:分布式团队的集体记忆外脑

AI结对编程:分布式团队的集体记忆外脑 “当新人通过AI瞬间掌握三年积累的业务规则时,传统‘传帮带’模式正式宣告过时——分布式团队最珍贵的资产不再是代码,而是被AI固化的集体经验。” 一、人脑的带宽困局 柏林新人加入新加坡支付团队,面临恐怖的知识迷宫: - …

栈----1.有效的括号

20. 有效的括号 - 力扣(LeetCode) /** 括号特性: 左括号必定先出现,每个左括号都需要一个右括号与之匹配,后出现的左括号先匹配 解法: 依据后出现的左括号先匹配,很容易联想到栈,即后进先出 遍历字符串,遇到左括号就在栈中添加一个对应的右括号 遇到右括…

数据报表怎么自动填写内容?总结了几个方法

你有没有遇到过这种情况?月底赶销售报告,Excel里密密麻麻的数据要往Word里搬,光是复制粘贴就折腾半小时,好不容易搞完,老板突然说数据有更新…得,全白干!更崩溃的是,这种重复劳动每个…

构造函数是否可以声明成虚函数?

构造函数(constructor)不能被声明为虚函数。✅ 原因解释 构造函数的主要职责是创建并初始化对象本身,而虚函数机制是基于 虚表指针(vptr) 的,它只有在对象构造完成之后才会起作用。 所以: 在构造…

【Rust线程池】如何构建Rust线程池、Rayon线程池用法详细解析

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

CAN总线网络的参数协同:从一致性要求到容差边界

CAN总线网络的参数协同:从一致性要求到容差边界 一、引言:CAN总线的“隐形契约”二、CAN通信的核心参数:不止于波特率三、参数一致性的必要性:为何波特率相同仍会失败?四、容差范围的科学界定:从理论计算到…

Activity 启动模式

如何指定 Activity 的启动模式&#xff1f;在 AndroidMainfest.xml 中通过给 <activity> 标签指定 android:lauchMode 来选择启动模式。4种启动模式standard&#xff08;默认&#xff09;&#xff1a;每当启动一个 Activity&#xff0c;都会创建一个新的实例压入返回栈。…

7·22胜算云AI日报:OpenAI再扩容且与英国政府签订三年AI计划、字节GR-3、微软Culture计划、国数局数据基地

OpenAI Oracle&#xff1a;4.5 GW「Stargate II」再扩容&#xff0c;AI 电力版图重排 7 月 22 日&#xff0c;OpenAI 与 Oracle 联合公布“Stargate II”计划&#xff1a;双方将在美国多地追加 4.5 GW 超算级电力与冷却配套&#xff0c;使 Stargate 系列园区总规模跃升至 5 GW…

【优选算法】链表

目录链表常用的技巧和操作1、常用技巧2、常用操作一、[两数相加](https://leetcode.cn/problems/add-two-numbers/description/)二、[两两交换链表中的节点](https://leetcode.cn/problems/swap-nodes-in-pairs/description/)三、[重排链表](https://leetcode.cn/problems/reor…