1 工具安装

1.1 下载链接

https://www.hiascend.com/developer/download/community/result?module=dl%2Bcann

1.2 安装指令:

./Ascend-mindx-toolbox_{version}_linux-{arch}.run --install设置环境变量:
source /usr/local/Ascend/toolbox/set_env.sh
source /usr/local/Ascend/ascend-toolkit/set_env.sh

2 带宽测试

分别执行一下四个指令

ascend-dmi --bw -t d2d
ascend-dmi --bw -t d2h
ascend-dmi --bw -t h2d
ascend-dmi --bw -t p2p

参考链接:https://www.hiascend.com/document/detail/zh/mindcluster/70rc1/toolbox/toolboxug/toolboxug_0015.html

参数说明:

参数说明约束是否必填
[-bw, --bw, --bandwidth]使用该参数测试芯片或整卡的带宽。支持-bw,但建议使用–bw或–bandwidth。-
[-t, --type]指测试数据流向的分类。当使用带宽测试功能时,测试的数据流可以分为以下方向,若不填写数据流方向则默认返回h2d、d2h、d2d三个方向的带宽和总耗时。h2d:指数据从Host侧内存通过PCIe总线搬移到Device侧内存,测试整体带宽及总耗时。(使用Atlas A3 训练系列产品带宽测试功能时,测试的为HCCS平面总带宽及总耗时。)d2h:指数据从Device侧内存通过PCIe总线搬移到Host侧内存,测试整体带宽及总耗时。(使用Atlas A3 训练系列产品带宽测试功能时,测试的为HCCS平面总带宽及总耗时。)d2d:指数据从Device侧内存搬移到同一Device侧内存(主要是用于测试Device侧的内存带宽),测试整体带宽及总耗时。p2p:测试指定源头Device到目标Device的传输速率和总耗时。说明使用p2p且不指定Device时(不指定-ds和-dd参数),-s、-et和-fmt参数不生效,使用定长模式和对应默认值。如ascend-dmi --bw -t p2p -fmt json命令中,-fmt参数不生效,使用默认值normal。Atlas 200I/500 A2 推理产品 仅支持d2d模式,不支持使用该参数。p2p模式仅支持 Atlas 训练系列产品 、Atlas A2 训练系列产品、 Atlas 800I A2 推理产品 、Atlas 300I Duo 推理卡、Atlas A3 训练系列产品。Atlas 300I Duo 推理卡使用p2p模式时,-ds和-dd参数仅支持主芯片的Device ID或同一张卡的主从芯片对应的Device ID。执行Atlas 200T A2 Box16 异构子框上两个8p之间的p2p测试时,仅支持输出两个对等位置的p2p结果,例如0卡对应8卡,可输出0卡传输至8卡的p2p测试结果,以此类推。
[-m, --mode]指定带宽测试模式,执行卡粒度或芯片粒度的带宽测试。不指定该参数时默认测试device粒度的带宽测试。device:表示芯片粒度,指昇腾芯片的逻辑ID。card:表示卡粒度,指昇腾芯片的卡ID,测试整卡的带宽。仅支持Atlas 900 A3 SuperPoD 超节点、Atlas 9000 A3 SuperPoD 集群算力系统、A200T A3 Box8 超节点服务器在type为p2p模式时,使用此参数。
[-s, --size]指传输数据大小并指定测试结果显示方式。传输数据的取值范围有以下情况:超节点系列产品:d2h/h2d/p2p这3种模式下,最大传输数值为1Byte4G。其他产品:1Byte512M。指定-s参数后面必须填写数值指定传输数据的大小,不填写属于错误写法。在h2d、d2h、d2d以及p2p且指定-ds和-dd场景。指定-s为定长模式。不指定-s为步长模式,传输数据的默认取值范围为2Byte~32M。p2p场景且不指定-ds和-dd场景。该场景下-s参数不生效,使用定长模式和默认值。默认值说明如下。Atlas A2训练系列产品、Atlas A3 训练系列产品,0卡或8卡到其他卡的默认传输数据大小为512M,除此之外,默认传输数据大小为256M。其他产品,传输数据大小默认值为128M。Atlas A2 训练系列产品、Atlas 800I A2 推理服务器、Atlas A3 训练系列产品若指定“-t”为d2d模式时,传输数据大小由AI Core决定,所以不支持使用“-s”参数。Atlas 200I/500 A2 推理产品 传输数据大小为固定值0.97GB(由传输数据的Tensor决定),不支持使用该参数。
[-et, --et, --execute-times]指迭代次数,即内存拷贝次数。取值范围为[1, 1000],若不填写,步长模式下拷贝次数则默认为5,定长模式下拷贝次数则默认为40。Atlas 200I/500 A2 推理产品 、Atlas 800I A2 推理服务器、Atlas A2 训练系列产品、Atlas A3 训练系列产品在d2d模式下,不支持使用该参数,拷贝次数默认为1。
[-d, --device]指定需要测试带宽的Device ID,Device ID是指昇腾AI处理器的逻辑ID。若填写Device ID时:默认返回对应的Device ID带宽信息,ID字段回显为对应的Device ID。若不填写Device ID时:使用Atlas 900 A3 SuperPoD 超节点、Atlas 9000 A3 SuperPoD 集群算力系统在d2d模式下默认返回Device 0带宽信息,ID字段回显为0;在d2h、h2d模式下默认返回全量Device带宽信息,ID字段回显为All。使用A200T A3 Box8 超节点服务器或非Atlas A3 训练系列产品在d2d、d2h、h2d模式下默认返回Device 0带宽信息,ID字段回显为0。为确保Atlas 300I Duo带宽测试结果达到最佳,建议测试Device 0带宽信息。Atlas A2 训练系列产品在p2p模式下,不支持使用该参数。
[-ds, --ds, --device-src]指定p2p测试的源头Device的ID号。必须与[-dd, --dd, --device-dst]参数成对指定;若与[-dd, --dd, --device-dst]参数同时不指定时,测试全量的昇腾NPU芯片。Atlas 200/300/500 推理产品 、 Atlas 推理系列产品 、Atlas 800I A2 推理服务器、 Atlas 200I/500 A2 推理产品 不支持使用该参数。
[-dd, --dd, --device-dst]指定p2p测试的目标Device的ID号。必须与[-ds, --ds, --device-src]参数成对指定;若与[-ds, --ds, --device-src]参数同时不指定时,测试全量的昇腾NPU芯片。Atlas 200/300/500 推理产品 、 Atlas 推理系列产品 、Atlas 800I A2 推理服务器、 Atlas 200I/500 A2 推理产品 不支持使用该参数。
[-fmt, --fmt, --format]指定输出格式,可以为normal或json。若未指定则默认为normal。-
[-q, --quiet]指定该参数时,将不再进行防呆提示,用户将默认允许该操作。若不指定该参数,将进行防呆提示,用户需要输入Y或N(y或n)确认是否进行测试。
[-h, --help]查看Ascend DMI工具“带宽测试”功能的帮助信息。-

3 使用实例

p2p测试命令截图取自训练服务器。

  • 以不带参数为例(不带参数则默认查询在Device 0,以h2d、d2h、d2d三个数据流向和步长模式显示的带宽耗时信息)。

    ascend-dmi --bw

  • 以测试数据从Host侧传输到Device 0,迭代100次的带宽与总耗时为例。

    • 定长模式。

      ascend-dmi --bw -t h2d -d 0 -s 8388608 --et 100

      若返回如图1所示信息,表示工具运行正常,图中参数介绍如表3所示。

      图1 带宽测试示例(定长模式)
      放大img

    • 步长模式。

      ascend-dmi --bw -t h2d -d 0 –et 100

      若返回如图2所示信息,表示工具运行正常,图中参数介绍如表3所示。

      图2 带宽测试示例(步长模式)
      img

  • 以测试数据从Device侧传输到同一Device侧的带宽与总耗时为例。

    ascend-dmi --bw -t d2d -d 0

    若返回如图3、图4、图5所示信息,表示工具运行正常,图中参数介绍如表3所示。

    图3 带宽测试示例(Atlas 训练系列产品)
    img

    图4 带宽测试示例(Atlas A2 训练系列产品)
    img

    ascend-dmi --bw -d 0

    图5 带宽测试示例(Atlas 200I/500 A2 推理产品)
    img

  • 测试指定源头Device到目标Device的传输速率和总耗时。

    • 以测试数据从源头Device 0传输到目标Device 1的p2p测试为例。

      ascend-dmi --bw -t p2p --ds 0 --dd 1 -s 6 -q

      若返回如图6所示信息,表示工具运行正常,图中参数介绍如表3所示。

      图6 p2p方式带宽测试示例
      img

      表3 显示界面参数介绍

      参数说明
      Host to Device Test带宽数据流方向。有以下显示可能:Host to Device TestDevice to Host TestDevice to Device TestUnidirectional Peer to Peer TestBidirectional Peer to Peer Test
      Device X : Ascend XXXDevice X为当前测试的设备ID,Ascend XXX为处理器类型。0表示源头设备,1表示目标设备。
      ID0:表示测试d2d、d2h、h2d模式下Device 0的带宽。0→1表示测试Device 0到Device 1的单向P2P带宽。0↔1表示测试Device 0和Device 1的双向P2P带宽。
      Size(Bytes)传输数据大小,单位为字节。
      Execute Times迭代次数
      Bandwidth(GB/s)芯片的带宽
      Elapsed Time(us)总执行时长
    • 不指定源头Device和目标Device的p2p样例。

      ascend-dmi --bw -t p2p

      若返回如图7所示信息,表示工具运行正常。

      图7 不指定device的p2p方式带宽测试示例
      img

  • 使用 Atlas 900 A3 SuperPoD 超节点 在p2p模式下,不指定源头Card和目标Card的p2p样例。

    ascend-dmi --bw -t p2p -q --mode card

    若返回如下所示信息,表示工具运行正常。

    [root@****]ascend-dmi --bw -t p2p -m card -q
    Unidirectional Peer to Peer Test Bandwidth Matrix(GB/s)C\C       0        1        2        3        4        5        6        70         ***      328.96   328.98   329.02   329.08   329.04   329.17   328.991         328.61   ***      328.58   328.56   328.48   328.55   328.53   328.572         328.57   328.49   ***      328.76   328.54   328.54   328.49   328.543         328.52   328.46   328.55   ***      328.72   328.50   328.54   328.544         329.02   329.05   328.99   329.03   ***      329.05   329.04   329.005         328.70   328.58   328.51   328.57   328.59   ***      328.56   328.566         328.56   328.53   328.63   328.58   328.61   328.57   ***      328.557         328.95   328.49   328.56   328.61   328.55   328.56   328.54   ***   Bidirectional Peer to Peer Test Bandwidth Matrix(GB/s)C\C       0        1        2        3        4        5        6        70         ***      540.51   540.39   540.50   541.80   541.90   541.05   540.341         540.90   ***      540.90   541.05   541.48   540.53   559.08   540.562         540.95   541.40   ***      540.61   540.45   540.76   540.80   541.783         540.97   540.87   541.61   ***      541.41   540.35   540.90   540.984         541.30   541.04   540.82   542.88   ***      540.40   541.13   540.685         540.68   541.14   541.86   540.80   540.44   ***      540.80   540.366         540.54   540.91   540.98   541.03   540.63   541.20   ***      541.277         540.51   542.78   540.91   541.69   540.22   540.95   541.02   ***   
    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85294.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85294.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/85294.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

生产BUG集

磁盘达到阈值导致ES无法删除数据 method [POST], host [http://xx.xxx.xxx.xxx:9200], URI [/security_event/_delete_by_query?slices1&requests_per_second-1&ignore_unavailablefalse&expand_wildcardsopen&allow_no_indicestrue&ignore_throttledtru…

基于FastAPI与Selenium的智能开关状态管理系统实践

引言 在工业物联网(IIoT)与自动化控制场景中,设备状态的实时监控与自然语言指令执行是提升效率的关键。本文将介绍一种基于 FastAPI 和 Selenium 的智能设备状态管理系统,通过大语言模型(LLM)解析用户指令…

主体和债项均为“AAA”等级 海尔消金发行10亿金融债

6月18日,继年内发行ABS、落地ESG挂钩银团贷后,海尔消费金融(以下简称“海尔消金”)在金融市场上又迈出重要一步,成功簿记发行2025年首期规模达10亿元金融债,且主体信用等级仍为“AAA”。这一举措为海尔消金…

n8n:轻松自动化您的工作流

借助开源自动化利器 n8n,释放重复劳动的生产力! 引言 n8n 是一款免费、开源的工作流自动化工具,致力于帮助开发者和团队通过连接各种应用和服务,实现重复任务的自动化处理。 它由 Jan Oberhauser 于 2019 年在德国柏林创建&…

Angular--Hello(TODO)

最近有个小错误,因为最近还是在看thingsboard,最近终于看到前端的代码,突然发现怎么全是ts的文件,仔细一看原来并不是之前认为的AngularJS,而是Angular。。。我tm真的无语了,又要去重新学。。。 Angular的…

在 Linux 系统中通过 yum 安装 Sublime Text

在 Linux 系统中通过 yum 安装 Sublime Text 的步骤如下: ​步骤 1:导入 GPG 公钥​ sudo rpm -v --import https://download.sublimetext.com/sublimehq-rpm-pub.gpg 这一步用于验证软件包的合法性。 ​步骤 2:添加 Sublime Text 的软件仓…

面向自主多星对地观测的多智能体强化学习

大家读完觉的有帮助记得及时关注和点赞!!! 抽象 近地轨道 (LEO) 卫星的指数级增长彻底改变了地球观测 (EO) 任务,解决了气候监测、灾害管理等方面的挑战。然而,多卫星系统…

flutter 短视频相关插件选型

​插件名称​​核心优势​​缺点​​短视频场景适用性​​推荐指数​​video_player​ (官方基础库)• 官方维护,跨平台兼容性最佳(iOS/Android/macOS) • 轻量级,无额外依赖,启动速度快 • 支持本地/网络视频、基础播…

QTableView为例:Qt模型视图委托(MVD)(Model-View-Delegate)

文章目录 1. QT中的MVD模式2. View3. Model4. Delegate5. 以TableView为例 1. QT中的MVD模式 模型视图委托(MVD)是Qt中特有的设计模式,类似MVC设计模式,将MVC设计模式中的Controller当做MVD中的Delegate,两者的概念基…

uni-app总结3-项目新建运行调试

一、新建项目 通过HbuilderX新建 在点击工具栏里的文件 -> 新建 -> 项目(快捷键CtrlN,MacOS上是CMD N): 左测Tab选择uni-app类型,输入工程名,选择模板,Vue版本选择3,其他不…

LeetCode 每日一题打卡|若谷的刷题日记 4day--移动零

移动零 题目: 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 请注意 ,必须在不复制数组的情况下原地对数组进行操作。 示例 1: 输入: nums [0,1,0,3,12] 输出: [1,3,1…

简历模板3——数据挖掘工程师5年经验

姓名 / Your Name 数据挖掘工程师 | 5年经验 | 推荐/画像/反欺诈 📞 138-XXXX-XXXX | ✉️ your.emailexample.com | 🌐 github.com/yourname | 📍 北京 🎯 个人简介 / Summary 5年大厂数据挖掘工程经验,硕士学历&am…

Vue添加图片作为水印

直接上代码 把图片作为水印 <div class"info-warp"><div class"image-container"><img src"https://img.shetu66.com/2023/06/28/1687920981963810.png" /><div class"watermark-layer"><imgv-for"…

Conda 常用命令大全:从入门到高效使用

Conda 常用命令大全&#xff1a;从入门到高效使用 Conda 是 Python 生态中最流行的环境管理工具之一&#xff0c;它不仅可以管理 Python 包&#xff0c;还能创建隔离的虚拟环境&#xff0c;适用于数据分析、机器学习、科学计算等场景。本文将介绍 Conda 的常用命令&#xff0c…

【系统更新】TDuckX2.7升级!DSL逻辑、自定义Webhook、AI考试来袭

No.1 支持自定义 DSL 公式 逻辑规则支持自定义 DSL&#xff0c;通过公式表达式构建复杂逻辑条件&#xff0c;能够支持选项、矩阵、自增表单中的内容控制&#xff0c;可以满足多变业务场景&#xff0c;极大提升了逻辑配置的灵活性。 No.2 扩展值新增“名称字段” 在批量生成扩…

安卓9.0系统修改定制化____深入解析安卓 9.0 各手机分区:功能、作用与差异 基础篇二

在安卓 9.0 系统中,手机内部存储被划分为多个不同的分区,每个分区都承担着独特且重要的职责。深入了解这些分区,对于我们理解安卓系统运行机制、进行系统优化,甚至是刷机等操作都有着极大的帮助。尤其是rom定制与修改方面。 通过博文了解💝💝💝 1💝💝💝-----了…

自动驾驶技术路线之争:视觉派、激光雷达派与融合派,谁将引领未来?

自动驾驶的赛道上&#xff0c;科技巨头、传统车企和初创公司纷纷亮出“看家本领”。但你是否注意到&#xff0c;不同玩家的“眼睛”和“大脑”配置大相径庭&#xff1f;特斯拉CEO马斯克曾称“激光雷达是徒劳的拐杖”&#xff0c;而国内华为、小鹏等企业则坚定拥抱激光雷达。这背…

Spring Cloud Alibaba 中间件

Spring Cloud Alibaba 中间件 &#x1f517; Spring官方介绍 [⚠️Spring官方对Spring Cloud Alibaba的更新不及时] &#x1f517; Spring Cloud Alibaba官网 &#x1f4dd; 代码记录 Nacos&#xff08;服务注册与发现&#xff09; Nacos(Dynamic Naming and Configuration…

uniapp+vue中 多次触发onLoad/created

控制台log输出为何频频失踪?   wxss代码为何频频失效?   wxml布局为何乱作一团?   究竟是道德的沦丧?还是人性的缺失?   让我们一起来 走 跑进科学 前言 uniapp中开发网页h5&#xff0c;莫名其妙每次请求接口都会执行两次&#xff0c;仔细排查发现是onLoadonShow…

[论文阅读] 人工智能+软件工程 | 软件工程中非代码工作的LLM能力评估

软件工程中非代码工作的LLM能力评估 论文信息 misc{2506.10833v1,title{Evaluating Large Language Models on Non-Code Software Engineering Tasks},author{Fabian C. Pea and Steffen Herbold},year{2025},eprint{2506.10833},archivePrefix{arXiv},primaryClass{cs.SE} }…