1. 进入华为云

华为云首页
点击右上角控制台
2025-06-17_212732.png

2.进入ModelArts

点击搜索框->搜索“ModelArts”->选择AI开发平台ModelArts->进入平台后点击开发者空间
image.png

3.创建Notebook

3.1在开发者空间中点击Notebook->在西南贵阳一下点击创建Notebook

image.png

3.2进入创建Notebook页面选择公共资源池中第2页的pytorch_2.1.0-cann_8.0.rc1-py_3.9-euler_2.10.7-aarch64-snt9b

image.png

3.3选择NPU与创建Notebook

image.png

4.打开服务器

等待创建完成后,单击后面的“打开”按钮将服务器打开。
image.png

5.安装Python

创建“python”版本的型号,点击上方的“+”,在展开的下拉菜单中选择“Notebook”
将以下代码放在Notebook中执行
conda create -n llamafactory python==3.10 -y
image.png

6.安装openMind Hub Client和openMind Library

切换到终端窗口,点击上方的“+”,在展开的下拉菜单中选择“Termianl”
在终端执行命令,激活或者启动昇腾资源服务。
source /usr/local/Ascend/ascend-toolkit/set_env.sh
image.png
查看创建的环境
conda env list
进入新建的python环境
conda activate llamafactory
image.png
安装“openMind Hub Client”(可能出现以下的错误,不影响下面的操作)
pip install openmind_hub
image.png
安装“openMind Library”,并安装“PyTorch”框架及其依赖(可能出现以下的错误,不影响下面的操作)
pip install openmind[pt]
image.png
安装和下载“LLaMa Factory”工具(报错没关系)
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch-npu,metrics]"
pip install numpy==1.23.5

7.安装符合Qwen3要求的transformers

请注意,这一点很重要,如果没安装,后面会报错没有qwen3模板

pip install --upgrade transformers==4.51.0

8.模型下载Qwen3

登录魔搭下载模型
魔搭官网
安装安装ModelScope
pip install modelscope
复制官网链接下载Qwen3模型,模型会下载在/home/ma-user/.cache/modelscope/hub/models/Qwen/Qwen3-8B下,可以使用mv命令移动到指定文件夹下
modelscope download --model Qwen/Qwen3-8B
进入模型下载路径
cd /home/ma-user/.cache/modelscope/hub/models/Qwen/Qwen3-8B
查看当前路径获取路径地址
pwd
/home/ma-user/.cache/modelscope/hub/models/Qwen/Qwen3-8B
使用mv命令移动到/home/ma-user/work/Model下,因为/home/ma-user/work下是进来显示的界面,是永久存储的(一开始选的100G云硬盘)
mv /home/ma-user/.cache/modelscope/hub/models/Qwen/Qwen3-8B /home/ma-user/work/Model
image.png

9.构造数据集,注册数据集,使用命令微调Qwen3

具体可以看llamafactory官网教程
llamafactory官网
llamafactory官网数据处理详解
在LLaMA-Factory/data 目录下的daraset_info.json中注册数据集,上传数据集到指定的位置
image.png
上传可以在要上传的文件夹下点击右上角上传,上传本地文件,如果文件过大,在弹出的提示中选择obs桶就行,默认就可以
image.png

10.使用命令微调Qwen3

查看npu,便于观察

npu-smi info
image.png

这是我的微调命令,根据自己的需求更改,其中NPU序列号是从0开始的,不用看别的,有几张卡都从0开始。

ASCEND_RT_VISIBLE_DEVICES=0,1 llamafactory-cli train
–stage sft
–do_train True
–model_name_or_path /home/ma-user/work/Model/Qwen3-8B
–preprocessing_num_workers $(nproc)
–finetuning_type lora
–template qwen3
–flash_attn auto
–dataset_dir data
–dataset Multimodal_stock_train_cot
–cutoff_len 3072
–learning_rate 5e-5
–num_train_epochs 3.0
–max_samples 100000
–per_device_train_batch_size 6
–gradient_accumulation_steps 4
–lr_scheduler_type cosine
–max_grad_norm 1.0
–logging_steps 5
–save_steps 100
–warmup_steps 0
–packing False
–enable_thinking True
–report_to none
–output_dir /home/ma-user/work/out/Qwen3-8B-text
–bf16 True
–plot_loss True
–trust_remote_code True
–ddp_timeout 180000000
–include_num_input_tokens_seen True
–optim adamw_torch
–lora_rank 8
–lora_alpha 16
–lora_dropout 0
–lora_target all

成功微调~

image.png

11.保存镜像

由于环境是创建在cache下的,关闭后是不会被保存的,能够保存的只有云硬盘,所以要保留环境要创建自己的镜像,具体操作是在运行状态下点击更多->保存镜像
image.png

评估推理以及合并都是llamafactory官方一样,就不说明了~

之后每次按照上述打开步骤打开平台就可以训练模型了,
按照以上步骤就能部署好NPU的平台了,其他的错误可能就是依赖冲突问题,升级合适的版本即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/85715.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/85715.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/85715.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于XES文件格式诸多问题

1. 格式类型是什么? case:concept:name (案例ID) - 必须是字符串类型concept:name (活动名称) - 字符串类型time:timestamp - 必须是datetime类型 2. 如何修改? data[case:concept:name] data[case:concept:name].astype(str)data[concept:name] data…

数据融合平台有哪些?在数据治理中发挥什么作用?

目录 一、常见的数据融合平台 (一)传统数据融合平台 (二)实时数据融合平台 (三)云数据融合平台 二、数据融合平台在数据治理中的作用 (一)提升数据质量 (二&#…

​​Linux:XFS 文件系统扩容完整指南

​​​问题背景​​ 在扩展 Linux 根目录 / 时,我遇到了一个错误: sudo resize2fs /dev/uos/root resize2fs: 超级块中的幻数有错 尝试打开 /dev/uos/root 时找不到有效的文件系统超级块。 经过排查,发现根本原因是 ​​文件系统类型是 XFS​​,而 resize2fs 仅适用于 e…

网络安全之CTF专题赛RE题解

easyre hap文件改成zip格式然后解压去反编译abc文件即可拿到源码 这里推荐一个网站.abcD 蛮好用的 下载反编译结果,解压后用vscode打开分析。 这里可以看到一些目录结构,我们先看看flag目录 x_2_2.count位1000000的时候就会输出flag那么大概率是一个点…

a padding to disable MSIE and Chrome friendly error page

问题 a padding to disable MSIE and Chrome friendly error page 解决 nginx 代理地址 配错了

71、C# Parallel.ForEach 详解

Parallel.ForEach 是 .NET Framework 4.0 引入的并行编程功能的一部分,位于 System.Threading.Tasks 命名空间中。它允许你对集合中的元素进行并行处理,可以显著提高处理大量数据时的性能。 基本用法 using System; using System.Collections.Generic;…

生产者-消费者模式在不同操作系统上的行为差异

在多线程编程中,生产者-消费者模式是一种常见的设计模式,用于解决线程间的数据同步问题。最近,我在 Linux 和 macOS 上运行同一个生产者-消费者模式的程序时,发现它们表现出不同的行为。本文将介绍这个现象、分析其原因&#xff0…

【JS-4.1-DOM获取元素操作】深入理解DOM操作:高效获取页面元素的方法与实践

在现代Web开发中,DOM(文档对象模型)操作是前端工程师的必备技能。而DOM操作的第一步,往往是从页面中获取我们需要操作的元素。本文将全面介绍各种获取页面元素的方法,分析它们的性能特点,并提供最佳实践建议…

UE5错误 Linux离线状态下错误 请求失败libcurl错误:6无法解析主机名

UE5错误 Linux离线状态下错误 请求失败libcurl错误:6无法解析主机名 完整描述问题解析解决方法 完整描述 loghttp:warning:ox015cba21400:request failed libcurl error :6 (couldn’t resolve host name ) 问题解析 这是因为在离线状态下…

深度学习实战111-基于神经网络的A股、美股、黄金对冲投资策略(PyTorch LSTM)

文章目录 一、A股与美股对冲互补投资方案1. 现象与逻辑2. 对冲互补投资思路3. 资金分配样例4. 最大化收益的关键二、对冲互补投资思路1. 资金分配原则2. 动态调整机制3. 对冲操作三、投资方案样例1. 初始资金分配(假设总资金10万元)2. 动态调整举例情景一:美股进入牛市,A股…

在线教育平台敏捷开发项目

项目背景 产品名称:LearnFlow(在线学习平台) 核心目标:6个月内上线MVP(最小可行产品),支持课程学习、进度跟踪、测验功能。 团队构成: 产品负责人(PO)1人 S…

C++面试题(35)-------找出第 n 个丑数(Ugly Number)

操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 我们把只包含质因子 2、3 和 5 的数称作丑数(Ugly Number)。例如 1, 2, 3, 4, 5, 6, 8, 9, 10, 12 是前 10 个丑数。 请编写一个函数,找出第 n …

Day03_数据结构(手写)

01.数据结构画图 02. //11.按值查找返回位置 int search_value(node_p H,int value) { if(HNULL){ printf("入参为空.\n"); return -1; …

【Java学习笔记】Collections工具类

Collections 工具类 基本介绍 &#xff08;1&#xff09;Collections 中提供了一系列静态方法对集合元素进行排序&#xff0c;查询和修改等操作 &#xff08;2&#xff09;操作对象&#xff1a;集合 常用方法一览表 方法描述reverse(List<?> list)反转 List 中元素…

spring-webmvc @ResponseBody 典型用法

典型用法 基本用法&#xff1a;返回 JSON 数据 GetMapping("/users/{id}") ResponseBody public User getUser(PathVariable Long id) {return userService.findById(id); }Spring 自动使用 Jackson&#xff08;或其他 HttpMessageConverter&#xff09;将 User 对…

AI-调查研究-08-跑步分析研究 潜在伤害与预防 不同年龄段与性别的情况

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; &#x1f680; AI篇持续更新中&#xff01;&#xff08;长期更新&#xff09; 目前2025年06月16日更新到&#xff1a; AI炼丹日志-29 - 字节…

AI任务相关解决方案9-深度学习在工业质检中的应用:基于DeepLabv3+模型的NEU-seg数据集语义分割研究

大家好我是微学AI,今天给大家介绍一下AI任务相关解决方案9-深度学习在工业质检中的应用:基于DeepLabv3+模型的NEU-seg数据集语义分割研究。DeepLabv3+模型在NEU-seg数据集上实现了高达87.65%的平均交并比(mIoU),为金属表面缺陷的高精度检测提供了有力工具。本文将详细探讨Dee…

mysql JSON_EXTRACT JSON_UNQUOTE 函数

在处理mysql 有存储的json字段&#xff0c;需要提取时候发现JSON_EXTRACT函数&#xff0c;发现此函数提取后会带有引号&#xff0c;组合使用JSON_UNQUOTE 可去掉引号&#xff01; JSON_EXTRACT 函数概述 JSON_EXTRACT是MySQL中用于从JSON文档中提取数据的函数&#xff0c;语法…

Prompt:更好的提示与迭代

欢迎来到啾啾的博客&#x1f431;。 记录学习点滴。分享工作思考和实用技巧&#xff0c;偶尔也分享一些杂谈&#x1f4ac;。 有很多很多不足的地方&#xff0c;欢迎评论交流&#xff0c;感谢您的阅读和评论&#x1f604;。 目录 1 引言1.1 引用资料 2 更好的提示2.1 情景学习IC…

SQL85 统计每个产品的销售情况

SQL85 统计每个产品的销售情况 好复杂&#xff0c;俺不中了。。 问题描述 本查询旨在分析2023年各产品的销售情况&#xff0c;包括&#xff1a; 每个产品的总销售额、单价、总销量和月均销售额每个产品销量最高的月份及其销量每个产品购买量最高的客户年龄段 解题思路 1. 基…