参考:
https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/
在这里插入图片描述

下载:
https://modelscope.cn/models/google/gemma-3n-E2B-it 模型下载

运行代码:
https://github.com/huggingface/huggingface-gemma-recipes

微调:
https://docs.unsloth.ai/basics/gemma-3n-how-to-run-and-fine-tune#fine-tuning-gemma-3n-with-unsloth

代码

报错:Set TORCHDYNAMO_VERBOSE=1 for the internal stack trace (please do this especially if you’re reporting a bug to PyTorch). For even more developer context, set TORCH_LOGS=“+dynamo”

解决:
import torch._dynamo
torch._dynamo.config.suppress_errors = True
torch._dynamo.disable()
import os
os.environ["TORCH_COMPILE"] = "0"
os.environ["TORCHDYNAMO_DISABLE"] = "1"
os.environ["DISABLE_TORCH_COMPILE"] = "1"

完整代码

from transformers import AutoProcessor, AutoModelForImageTextToText
import torchdevice = torch.device("cuda" if torch.cuda.is_available() else "cpu")import torch._dynamo
torch._dynamo.config.suppress_errors = True
torch._dynamo.disable()
import os
os.environ["TORCH_COMPILE"] = "0"
os.environ["TORCHDYNAMO_DISABLE"] = "1"
os.environ["DISABLE_TORCH_COMPILE"] = "1"model_id = "./gemma-3n-E2B-it" # google/gemma-3n-e2b-it
processor = AutoProcessor.from_pretrained(model_id)
model = AutoModelForImageTextToText.from_pretrained(model_id).to(device)def model_generation(model, messages):inputs = processor.apply_chat_template(messages,add_generation_prompt=True,tokenize=True,return_dict=True,return_tensors="pt",)input_len = inputs["input_ids"].shape[-1]inputs = inputs.to(model.device, dtype=model.dtype)with torch.inference_mode():generation = model.generate(**inputs, max_new_tokens=32)generation = generation[:, input_len:]decoded = processor.batch_decode(generation, skip_special_tokens=True)print(decoded[0])

文本推理

# Text
messages = [{"role": "user","content": [{"type": "text", "text": "你是谁"}]}
]
model_generation(model, messages)

图像+文本推理

#   Image Onlymessages = [{"role": "user","content": [{ "type": "image", "image" : "./下载.jpg" },{"type": "text", "text": "详细描述这张图片"}]}
]
model_generation(model, messages)

语音+文本推理

# Interleaved with Audiomessages = [{"role": "user","content": [{"type": "text", "text": "Transcribe the following speech segment in English:"},{"type": "audio", "audio": "test-16b-caps.wav"},]}
]
model_generation(model, messages)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/87918.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/87918.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/87918.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络实验——互联网安全实验

实验1. OSPF路由项欺骗攻击和防御实验一、实验目的验证路由器OSPF配置过程。验证OSPF建立动态路由项过程。验证OSPF路由项欺骗攻击过程。验证OSPF源端鉴别功能的配置过程。验证OSPF防路由项欺骗攻击功能的实现过程。二、实验任务使用自己的语言简述该实验原理。如图1所示的网络…

Pytorch中torch.where()函数详解和实战示例

torch.where() 是 PyTorch 中非常常用的一个函数,功能类似于 NumPy 的 where,用于条件筛选或三元选择操作。在深度学习训练、掩码操作、损失函数处理等场景中非常常见。一、基本语法 torch.where(condition, x, y)condition:一个布尔张量&…

基于Hadoop的公共自行车数据分布式存储和计算平台的设计与实现

文章目录 有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主项目介绍:基于Hadoop的公共自行车数据分布式存储与计算平台设计与实现数据介绍数据预处理 Hadoop 集群的几个主要节点介绍1. NameNode(主节点)2. DataNod…

Java项目:基于SSM框架实现的程序设计课程可视化教学系统【ssm+B/S架构+源码+数据库+毕业论文】

摘 要 使用旧方法对程序设计课程可视化教学信息进行系统化管理已经不再让人们信赖了,把现在的网络信息技术运用在程序设计课程可视化教学信息的管理上面可以解决许多信息管理上面的难题,比如处理数据时间很长,数据存在错误不能及时纠正等问题…

Unity 实现 NPC 随机漫游行为的完整指南

在游戏开发中,NPC(非玩家角色)的行为逻辑对于营造真实、沉浸式的游戏世界至关重要。一个常见但又极具表现力的需求是:让 NPC 在场景中自然地随机移动,仿佛它们有自己的意识和目的地。 本文将详细介绍如何使用 Unity 的…

重新学习Vue中的按键监听和鼠标监听

文章目录按键事件1. 使用 keyup.enter 修饰符2. 使用 v-on 监听键盘事件3. 在组件上监听原生事件Vue 2Vue 34. 全局监听键盘事件注意事项鼠标事件1. 基本鼠标事件监听常用鼠标事件2. 事件修饰符3. 鼠标按键检测4. 鼠标位置信息5. 自定义指令监听鼠标事件6. 组合鼠标事件7. 性能…

vue2启动问题以及解决方案

vue2启动时:ERROR Invalid options in vue.config.js: "typescript.validate.enable" is not allowed如果需要在 VSCode 中控制 TypeScript 验证:在项目根目录创建 .vscode/settings.json 文件(如不存在)添加以下配置&a…

Vue响应式系统:从原理到核心API全解析

响应式原理 响应式机制的主要功能就是,可以把普通的JavaScript对象封装成为响应式对象,拦截数据的读取和设置操作,实现依赖数据的自动化更新。 Q: 如何才能让JavaScript对象变成响应式对象? 首先需要认识响应式数据和副作用函数…

水下目标检测:突破与创新

水下目标检测技术背景 水下环境带来独特挑战:光线衰减导致对比度降低,散射引发图像模糊,色偏使颜色失真。动态水流造成目标形变,小目标(如1010像素海胆)检测困难。声呐与光学数据融合可提升精度&#xff0…

高通SG882G平台(移远):2、使用docker镜像编译

其实之前已经编译过了。今日搜索时发现,只有当时解决问题的汇总,没有操作步骤。于是记录下来。 建议使用Ubuntu20 LTS。 安装docker $ sudo apt update $ sudo apt install docker.io $ sudo docker -v Docker version 27.5.1, build 27.5.1-0ubuntu3…

轻松上手:使用Nginx实现高效负载均衡

接上一篇《轻松上手:Nginx服务器反向代理配置指南》后,我们来探讨一下如何使用Nginx实现高效负载均衡。 在当今高并发、大流量的互联网环境下,单台服务器早已无法满足业务需求。想象一下:一次电商平台的秒杀活动、一个热门应用的…

身份证号码+姓名认证接口-身份证二要素核验

身份证号实名认证服务接口采用身份证号码、姓名二要素核验的方式,能够快速确认用户身份。无论是新用户注册,还是老用户重要操作的身份复核,只需输入姓名及身份证号,瞬间即可得到 “一致” 或 “不一致” 的核验结果。这一过程高效…

自动驾驶基本概念

目录 自动驾驶汽车(Autonomous Vehicles ) 单车智能 车联网 智能网联(单车智能车联网) 自动驾驶关键技术 环境感知与定位 车辆运动感知 车辆运动感知 路径规划与决策 自动驾驶发展历程 自动驾驶应用场景 自动驾驶路测…

提示词框架(10)--COAST

目前,有很多提示词框架都叫COAST,但是每个的解释都不同,出现很了很多解释和演化版本,不要在意这些小事,我们都是殊途同归--让AI更好的完成任务COAST框架,比较适合需要详细背景和技术支持的任务,…

基于selenium实现大麦网自动抢票脚本教程

闲来无事,打开大麦网发现现在大多数演唱票都需要手机端才能抢票,仅有很少一部分支持pc端用网页去抢票,但正所谓:道高一尺,魔高一丈,解决这个反爬问题,我们可以采用Airtest连接仿真机来模拟手机端…

2048小游戏实现

2048小游戏实现 将创建一个完整的2048小游戏,包含游戏核心逻辑和美观的用户界面。设计思路 4x4网格布局响应式设计,适配不同设备分数显示和最高分记录键盘控制(方向键)和触摸滑动支持游戏状态提示(胜利/失败&#xff0…

Windows VMWare Centos Docker部署Springboot + mybatis + MySql应用

前置文章 Windows VMWare Centos环境下安装Docker并配置MySqlhttps://blog.csdn.net/u013224722/article/details/148928081 Windows VMWare Centos Docker部署Springboot应用https://blog.csdn.net/u013224722/article/details/148958480 Windows VMWare Centos Docker部署…

【科普】Cygwin与wsl与ssh连接ubuntu有什么区别?DIY机器人工房

Cygwin、WSL(Windows Subsystem for Linux)和通过 SSH 连接 Ubuntu 是三种在 Windows 环境下与类 Unix/Linux 系统交互的工具,但它们的本质、运行环境、功能范围有显著区别。以下从核心定义、关键差异和适用场景三个维度详细说明:…

Web前端数据可视化:ECharts高效数据展示完全指南

Web前端数据可视化:ECharts高效数据展示完全指南 当产品经理拿着一堆密密麻麻的Excel数据走向你时,你知道又到了"化腐朽为神奇"的时刻。数据可视化不仅仅是把数字变成图表那么简单,它是将复杂信息转化为直观洞察的艺术。 在过去两…

# IS-IS 协议 | LSP 传输与链路状态数据库同步机制

略作整理,待校。 SRM 和 SSN 标志的作用 SRM 标志 功能:SRM 标志用于跟踪路由器从一个接口向邻居发送链路状态协议数据单元(LSP)的状态。作用:确保 LSP 的正确传输和状态跟踪。 SSN 标志 广播网络 功能&#xff1…