pingmian/2025/9/8 5:41:50/文章来源:https://blog.csdn.net/qq_44908396/article/details/151190549

本文不生产技术，只做技术的搬运工！！

前言

公开的Qwen2.5-VL模型虽然功能非常强大，但有时面对专业垂直领域的问题往往会出现一些莫名其妙的回复，这时候大家一版选择对模型进行微调，而微调后的模型如果直接部署则显存开销过大，这时就需要执行量化，下面将介绍执行本地GPTQ量化的具体流程。

ms-swift

由于作者没有找到AutoGPTQ框架下进行Qwen2.5-VL的量化教程，所以干脆偷懒，使用ms-swift进行量化

这里安装完成后还需要补充一下安装

pip install qwen_vl_utils
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0

执行量化

CUDA_VISIBLE_DEVICES=0,1,2,3 \
swift export \--model /data/qwen2.5-vl-32b/ \--dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' \

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/pingmian/95739.shtml
繁体地址，请注明出处：http://hk.pswp.cn/pingmian/95739.shtml
英文地址，请注明出处：http://en.pswp.cn/pingmian/95739.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【Redis】常用数据结构之Hash篇：从常用命令到使用场景详解

【Redis】常用数据结构之Hash篇：从常用命令到使用场景详解

目录 1.前言插播一条消息~ 2.正文 2.1Hash与String对比 2.2常用命令 2.2.1HSET 2.2.2HGET 2.2.3HEXISTS 2.2.4HDEL 2.2.5HKEYS 2.2.6HVALS 2.2.7HGETALL 2.2.8HMGET 2.2.9HLEN 2.2.10HSETNX 2.2.11HINCRBY 2.2.12HINCRBYFLOAT 2.3内部编码 2.3.1. ziplist&…

阅读更多...

OSPF基础部分知识点

OSPF基础部分知识点

OSPF基础前言路由器根据路由表转发数据包，路由表项可通过手动配置和动态路由协议生成。（两种生成方式）静态路由比动态路由使用更少的带宽，并且不占用CPU资源来计算和分析路由更新。当网络结构比较简单时，只需配…

阅读更多...

Flutter 真 3D 游戏引擎来了，flame_3d 了解一下

Flutter 真 3D 游戏引擎来了，flame_3d 了解一下

在刚刚结束的 FlutterNFriends 大会上，Flame 展示了它们关于 3D 游戏的支持：flame_3d ，Flame 是一个以组件系统（Flame Component System, FCS）、游戏循环、碰撞检测和输入处理为核心的 Flutter 游戏框架，而…

阅读更多...

无需公网IP，电脑随时与异地飞牛同步互联保持数据一致性

无需公网IP，电脑随时与异地飞牛同步互联保持数据一致性

最近小白有这样一个烦恼：随身带着的电脑每天都在更新内容，于是就会有很多很多的存稿。电脑的空间开始变得不够用了。各式各样的图片、视频、文稿等内容，如果要整理到飞牛NAS上，好像很麻烦，而且每次都是需要回到家里才能…

阅读更多...

数据库中间件ShardingSphere v5.2.1

数据库中间件ShardingSphere v5.2.1

数据库中间件ShardingSphere v5.2.1 文章目录数据库中间件ShardingSphere v5.2.1一概述1 数据库的瓶颈2 优化的手段3 主从复制4 读写分离5 分库分表5.1 背景5.2 垂直分片5.3 水平分片6 ShardingSphere简介二 ShardingSphere-JDBC讲解1 读写分离实现1.1 基于Docker搭建MySQL主从…

阅读更多...

[Upscayl图像增强] Electron主进程命令 | 进程间通信IPC

[Upscayl图像增强] Electron主进程命令 | 进程间通信IPC

第三章：Electron主进程命令欢迎回来🐻‍❄️ 在第一章：渲染器用户界面（前端）中，我们探索了您与之交互的按钮和菜单。然后在第二章：AI模型中，我们了解了让您的图像看起来更棒的&qu…

阅读更多...

电竞护航小程序成品搭建三角洲行动护航小程序开发俱乐部点单小程序成品游戏派单小程序定制

电竞护航小程序成品搭建三角洲行动护航小程序开发俱乐部点单小程序成品游戏派单小程序定制

功能列表：商家入驻成为管事平台公告客服密钥客服管理发单模板快捷发单自定义发单打手入驻订单裁决即时通讯 （接单者员与发单者） 打手排行邀请排行余额提现技术栈：前端uniapp 后端java

阅读更多...

Redis数据库基础

Redis数据库基础

1.关系型数据库和NoSQL数据库数据库主要分为两大类:关系型数据库与NoSQL数据库关系型数据库，是建立在关系模型基础是的数据库，其借助集合代数等数学概念和方法来处理数据库中的数据主流的MySQL，Oracle，MS SQL Server 和DB2都属于这…

阅读更多...

【Java实战㉗】Java日志框架实战：Logback与Log4j2的深度探索

【Java实战㉗】Java日志框架实战：Logback与Log4j2的深度探索

目录一、日志框架概述1.1 日志的作用1.2 常见日志框架1.3 日志级别二、Logback 框架实战2.1 Logback 依赖导入2.2 Logback 配置文件2.3 日志输出格式自定义2.4 Logback 进阶配置三、Log4j2 框架实战3.1 Log4j2 依赖导入3.2 Log4j2 配置文件3.3 Log4j2 与 SLF4J 整合3.4 日志框架…

阅读更多...

基于WFOA与BP神经网络回归模型的特征选择方法研究(Python实现)

基于WFOA与BP神经网络回归模型的特征选择方法研究(Python实现)

说明：这是一个机器学习实战项目（附带数据代码文档），如需数据代码文档可以直接到文章最后关注获取或者私信获取。 1.项目背景在大数据分析与智能建模领域，高维数据广泛存在于金融预测、环境监测和工业过程控制等场景…

阅读更多...

AI生成PPT工具推荐，从此以后再也不用担心不会做PPT了

AI生成PPT工具推荐，从此以后再也不用担心不会做PPT了

对于很多人老说，做ppt实在太麻烦了，快速制作出专业且美观的PPT成为众多人的需求，AI生成PPT工具应运而生，极大地提升了PPT制作的效率。以下为大家推荐多个实用的AI生成PPT工具。 1、AiPPT星级评分：★★★★★ AiPPT是一…

阅读更多...

CentOS系统停服，系统迁移Ubuntu LTS

CentOS系统停服，系统迁移Ubuntu LTS

CentOS官方已全面停止维护CentOS Linux项目，公告指出 CentOS 7在2024年6月30日停止技术服务支持，(在此之前 2022年1月1日起CentOS官方已经不再对CentOS 8提供服务支持），详情见CentOS官方公告。一、系统迁移评估用户需要开始计…

阅读更多...

Linux知识回顾总结----文件系统

Linux知识回顾总结----文件系统

上章讲的是 os 如果管理被打开的文件，那么没有被打开的文件（也就是在磁盘单中的文件）使用文件系统进行管理。了解完这一章，我们就可以理解我们如果想要打开一个文件的是如何找到整个文件，然后如何把它加载到内存中的&a…

阅读更多...

iOS蓝牙使用及深入剖析高频高负载传输丢包解决方案（附源码）

iOS蓝牙使用及深入剖析高频高负载传输丢包解决方案（附源码）

最近开发了一套iOS原生的蓝牙SDK，总结了一些有价值的踩过的坑，分享出来给有需要的同学做个参考。一、蓝牙的使用 iOS有一套封装好的完善的蓝牙API ，可以很便捷的实现与蓝牙的连接和通信，蓝牙通信的大体流程如下，先对基…

阅读更多...

Python 正则表达式实战：用 Match 对象轻松解析拼接数据流

Python 正则表达式实战：用 Match 对象轻松解析拼接数据流

摘要这篇文章围绕 Python 的正则表达式 Match 对象（特别是 endpos、lastindex、lastgroup 以及 group / groups 等方法/属性）做一个从浅入深、贴近日常开发场景的讲解。我们会给出一个真实又常见的使用场景：解析由设备/服务发来的“拼接式”…

阅读更多...

基于Pygame的六边形战术推演系统深度剖析——从数据结构到3D渲染的完整实现（附完整代码）

基于Pygame的六边形战术推演系统深度剖析——从数据结构到3D渲染的完整实现（附完整代码）

1. 项目概述与技术选型战术推演系统是军事训练和游戏开发中的重要组成部分，它能够模拟真实的战术场景，为用户提供策略思考的平台。本文将深入分析一套基于Python Pygame框架开发的城市巷战战术推演系统，该系统采用六边形网格布局，实现了恐怖分子与反恐精英的对抗模拟，具…

阅读更多...

支持二次开发的代练App源码：订单管理、代练监控、安全护航功能齐全，一站式解决代练护航平台源码（PHP+ Uni-app）

支持二次开发的代练App源码：订单管理、代练监控、安全护航功能齐全，一站式解决代练护航平台源码（PHP+ Uni-app）

一、技术架构：高性能与跨平台的核心支撑前端框架Uni-app：基于Vue.js的跨平台框架，支持编译至微信小程序、H5、iOS/Android App及PC端，代码复用率超80%，显著降低开发成本。实时通信：集成WebSocket实现订单状…

阅读更多...

AI热点周报（8.31~9.6）： Qwen3‑Max‑Preview上线、GLM-4.5提供一键迁移、Gemini for Home，AI风向何在？

AI热点周报（8.31~9.6）： Qwen3‑Max‑Preview上线、GLM-4.5提供一键迁移、Gemini for Home，AI风向何在？

名人说：博观而约取，厚积而薄发。——苏轼《稼说送张琥》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder😊） 目录一、3分钟速览版：一张表看懂本周AI大事二、国内：模型与生态的…

阅读更多...

异步操作终止2

异步操作终止2

您提的这个问题非常棒，说明您思考得非常深入！您完全正确，我之前的示例中使用的 return; 会中断 handleDraw 函数中所有后续的逻辑，这在很多场景下并不是我们想要的。我们的目标是只中断画图这一个特定的逻辑，而让函数…

阅读更多...

《AI大模型应知应会100篇》第67篇 Web应用与大模型集成开发实践——1小时打造国产大模型智能客服系统

《AI大模型应知应会100篇》第67篇 Web应用与大模型集成开发实践——1小时打造国产大模型智能客服系统

第67篇：Web应用与大模型集成开发实践——1小时打造国产大模型智能客服系统一句话核心价值：无需翻墙！用Flask国产大模型API（通义/文心一言/讯飞）快速构建合规Web问答系统，电商客服人力成本直降70%&#xff…

阅读更多...

最新文章