假设你有两部分:

  • 一个是原始大模型(base model)
  • 一个是保存的 LoRA Adapter(adapter_config.json + adapter_model.bin)

不合并的情况下推理方法

你可以用 peft 的方式加载 LoRA Adapter,推理时这样写:

from transformers import AutoModel, AutoTokenizer
from peft import PeftModel# 1. 加载原始大模型
base_model = AutoModel.from_pretrained("原始模型路径",trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained("原始模型路径",trust_remote_code=True
)# 2. 加载 LoRA Adapter
model = PeftModel.from_pretrained(base_model,"lora_adapter保存路径"
)# 3. 推理
inputs = tokenizer("你的输入", return_tensors="pt")
outputs = model.generate(**inputs)
print(tokenizer.decode(outputs[0]))
  • "原始模型路径":假设就是你原始 ChatGLM-3 6B 的本地路径
  • "lora_adapter保存路径":就是你训练保存的 lora 目录

这样就可以直接用 LoRA 微调后的模型推理,无需合并!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/84489.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/84489.shtml
英文地址,请注明出处:http://en.pswp.cn/web/84489.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谷歌时间序列算法:零样本预测如何重塑行业决策?

谷歌时间序列算法:零样本预测如何重塑行业决策? TimesFM 你是否曾面临这样的困境?—— ▸ 需要预测新产品销量,却苦于缺乏历史数据; ▸ 依赖传统模型(如ARIMA),但调参耗时且泛化能力…

国产服务器【银河麒麟v10】【CPU鲲鹏920】部署Minio文件服务器

目录 准备工作操作步骤1. 确认挂载点状态2. 创建专用用户和目录3. 下载ARM版Minio到挂在盘4. 环境变量配置5. 更新Systemd服务配置6. 启动、重启7. 防火墙8. 访问验证9. 故障排查(如服务未启动)​ 结束 准备工作 环境要求:Linux虚拟机 操作…

解决: React Native android webview 空白页

Android react-native-webview 之前是正常的, 升级了 react-native / react-native-webview 等 之后, 就变成了空白页. 通过下面的修改, 可以修复, 回到正常的状态. 来源: https://github.com/react-native-webview/react-native-webview/issues/3697 注意 ts 文件一定要改,…

高中编程教学中教师专业发展的困境与突破:基于实践与理论的双重审视

一、引言 1.1 研究背景 在数字化时代,编程已成为一项基本技能,其重要性日益凸显。编程不仅是计算机科学领域的核心能力,更是培养学生逻辑思维、创新能力和问题解决能力的有效途径。高中阶段作为学生成长和发展的关键时期,开展编…

最小化联邦平均(FedAvg)的算法开销

一、通信开销最小化 FedAvg中服务器与客户端间的频繁参数传输是主要瓶颈,可通过以下方法优化: 1. 模型压缩技术 稀疏化:仅上传重要参数更新(如Top-k梯度) 实现:客户端本地训练后,保留绝对值最…

准备开始适配高德Flutter的鸿蒙版了

我们的Flutter项目在编译为鸿蒙的过程中, 遇到了各种插件不支持的问题。 大部分都能解决,或者用别的方式代替。 这个高德我真的是无语, 我们只能用高德 , 目前还没看到网上有人适配了鸿蒙。 那就我来干吧, 第一…

webpack到vite的改造之路

前言 随着前端项目的持续迭代与功能扩展,当前基于 Webpack 构建的项目在启动速度、构建速度和首屏加载性能方面逐渐暴露出一些瓶颈。 一方面,Webpack 的打包机制导致本地开发环境的启动时间显著增加,严重影响了开发效率;另一方面…

【重构】如果发现提取的方法不再通用,如何重构

前言 所谓重构(refactoring): 在不改变代码外在行为的前提下,对代码做出修改,以改进程序的内部结构。 – Martin Fowler背景 最近在做需求,需要对方法加权限控制,发现旧方法不再适用&#xff0…

REST接口/RPC

REST接口(RESTful API)是一种基于HTTP协议的API设计风格,遵循REST(Representational State Transfer表述性状态转移)架构原则,用于在不同系统之间进行数据交互。它具有简洁、灵活、无状态等特点,广泛应用于Web服务和移动应用开发中。 核心概念 资源导向 将数据或服务抽…

JS入门——事件与事件绑定

JS入门——事件与事件绑定 一、事件的分类 二、事件的绑定方式 实现代码&#xff1a; <!DOCTYPE html> <html><head><meta charset"utf-8"><title>JS事件绑定</title></head><body><!-- 修复后的按钮1 -->&…

pyspark 处理字符串函数

pyspark 要处理数据&#xff0c;没有&#xff0c;那就伪造数据 faker 真是个好东西 from faker import Faker import pandas as pd gender ["None","Man","Woman"]fake Faker() names [(fake.first_name(),fake.last_name(),fake.date_of_bi…

五大经典语音芯片型号及应用场景

在语音芯片领域&#xff0c;这五大语音芯片凭借丰富多样的产品和卓越的性能&#xff0c;占据了重要地位。以下为您详细介绍其五款经典语音芯片型号及其对应的应用场景。​ WTN6170-8S​ WTN6170-8S 属于 OTP 一次性语音芯片。它采用 OTP 工艺&#xff0c;成本能够控制在 1 元以…

机器学习管道:构建高效可靠的AI工作流

在当今数据驱动的世界中&#xff0c;机器学习(ML)已成为推动创新和决策的核心技术。然而&#xff0c;将ML模型从实验环境成功部署到生产环境并非易事。机器学习管道(ML Pipelines)作为一种系统化的解决方案&#xff0c;通过自动化工作流程&#xff0c;显著提高了ML项目的可重复…

浏览器调试核心技术指南:从基础到高级的完全掌握

引言​​ 在现代前端开发中,浏览器调试工具已成为开发者最强大的技术伙伴。根据State of JS 2023的统计数据,​​92.7%的专业开发者​​每天使用浏览器DevTools进行问题诊断和性能优化。然而,多数初级开发者仅能使用不到35%的调试功能。本文将系统解析Chrome/Firefox浏览器…

OpenCV 图像翻转

一、知识点 1、void flip(InputArray src, OutputArray dst, int flipCode); (1)、围绕x轴、y轴或两者同时翻转图像。 (2)、参数说明: src: 输入图像。 dst: 输出图像&#xff0c;大小与类型和src相同。 flipCode: 翻转标志。 0表示绕x轴翻转(上下翻转);…

【动手学深度学习】4.2~4.3 多层感知机的实现

目录 4.2. 多层感知机的从零开始实现1&#xff09;初始化模型参数2&#xff09;激活函数3&#xff09;模型4&#xff09;损失函数5&#xff09;训练 4.3. 多层感知机的简洁实现1&#xff09;模型2&#xff09;小结 . 4.2. 多层感知机的从零开始实现 现在让我们实现一个多层感…

54-Oracle 23 ai DBMS_HCHECK新改变-从前的hcheck.sql

Oracle Hcheck&#xff08;Health Check&#xff09;是Oracle数据库内置的健康监测工具&#xff0c;自动化检查数据库的核心问题&#xff0c;包括数据字典一致性、性能瓶颈、空间使用及安全隐患。本质是数据字典的CT扫描仪&#xff0c;其核心价值在于将“字典逻辑错误”这类灰色…

AI 产品的“嵌点”(Embedded Touchpoints)

核心主题&#xff1a; AI 产品的成功不在于功能的强大与独立&#xff0c;而在于其能否作为“嵌点”&#xff08;Embedded Touchpoints&#xff09;无缝融入用户现有的行为流&#xff08;Flow&#xff09;&#xff0c;消除微小摩擦&#xff0c;在用户真正需要的时机和场景中“无…

如何在WordPress中添加导航菜单?

作为一个用了很多年 WordPress 的用户&#xff0c;我特别清楚导航菜单有多重要。一个清晰的导航菜单能让访问者快速找到他们想要的信息&#xff0c;同时也能提升网站的用户体验。而对于WordPress用户来说&#xff0c;学会如何添加和自定义导航菜单是构建高质量网站的第一步。今…

【pdf】Java代码生成PDF

目录 依赖 创建单元格 表格数据行辅助添加方法 创建表头单元格 创建下划线 创建带下划线的文字 创建PDF 依赖 <dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.4.2</version> <…