前言

在计算机视觉领域,图像分类是一个基础且重要的任务。本文将介绍如何使用MobileNetV3预训练模型来训练一个水果分类模型,并通过Flask框架进行部署。MobileNetV3作为轻量级网络,在保持较高精度的同时,具有较快的推理速度,非常适合实际应用场景。

环境准备

首先,我们需要准备以下环境:

# 主要依赖包
torch>=1.7.0
torchvision>=0.8.0
flask>=2.0.0
pillow>=8.0.0
numpy>=1.19.0
requests>=2.25.0  # 用于数据采集
matplotlib>=3.3.0  # 用于绘制训练曲线

数据集准备

1. 数据采集

我们使用百度图片API来采集水果图片数据。以下是数据采集的代码实现:

import requests
import osdef get_images(keyword, page_num):headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36'}url = 'https://image.baidu.com/search/acjson?'# 设置图片保存路径download_path = os.path.join("./data", keyword)if not os.path.exists(download_path):os.makedirs(download_path)# 构造请求参数params = {'tn': 'resultjson_com','word': keyword,'pn': 0,'rn': 30,# ... 其他参数}# 下载图片for i in range(page_num):params["pn"] = i*30response = requests.get(url, params=params, headers=headers)# 处理返回结果并保存图片

2. 数据集组织

将采集到的图片按照以下结构组织:

data/├── apple/│   ├── 0.jpg│   ├── 1.jpg│   └── ...├── banana/│   ├── 0.jpg│   ├── 1.jpg│   └── ...└── ...

模型训练

1. 数据加载和预处理

from torchvision import transforms
from torchvision.datasets import ImageFolder
from torch.utils.data import random_split, DataLoader# 图像预处理
transform = transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])# 加载数据集
dataset = ImageFolder("data", transform=transform)# 保存类别标签
with open("label.txt", "w", encoding="UTF-8") as f:for line in dataset.classes:f.write(line + "\n")# 划分训练集和测试集
train_ratio = 0.8
train_size = int(len(dataset) * train_ratio)
test_size = len(dataset) - train_size
train_dataset, test_dataset = random_split(dataset, [train_size, test_size])# 创建数据加载器
batch_size = 64
train_loader = DataLoader(train_dataset, batch_size=batch_size)
test_loader = DataLoader(test_dataset, batch_size=batch_size)

2. 模型定义

from torchvision import models
import torch.nn as nn# 使用MobileNetV3-Small预训练模型
model = models.mobilenet_v3_small(pretrained=True)
# 修改最后的分类层
model.classifier[3] = nn.Linear(in_features=1024, out_features=5)  # 5个类别# 如果有GPU则使用GPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = model.to(device)

3. 训练过程

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)# 训练参数
num_epochs = 20
best_valid_acc = 0
best_model = None# 记录训练过程
train_losses = []
valid_losses = []
train_accs = []
valid_accs = []for epoch in range(num_epochs):# 训练阶段model.train()train_loss = 0.0train_acc = 0.0total = 0for inputs, labels in train_loader:inputs, labels = inputs.to(device), labels.to(device)optimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, labels)loss.backward()optimizer.step()train_loss += loss.item()_, predicted = torch.max(outputs, 1)train_acc += (predicted == labels).sum().item()total += len(labels)

Flask部署

1. 创建Flask应用

2. 实现预测接口

@app.route('/predict', methods=['POST'])
def predict():if 'image' not in request.files:return render_template('index.html', prediction=None)image_file = request.files['image']image_data = image_file.read()# 图像预处理img = Image.open(io.BytesIO(image_data))img = transform(img)img = torch.unsqueeze(img, dim=0)# 模型预测with torch.no_grad():prediction = model(img)prediction = F.softmax(prediction, dim=1)# 获取预测结果pred_label = class_labels[torch.argmax(prediction).item()]confidence = torch.max(prediction).item()return render_template('index.html', prediction=pred_label,confidence=confidence)

部署步骤

  1. 确保服务器已安装Python环境
  2. 安装所需依赖包:
pip install -r requirements.txt

  1. 将模型文件、Flask应用和模板文件上传到服务器
  2. 运行Flask应用:
python app.py

总结

本文详细介绍了使用MobileNetV3训练水果分类模型并用Flask部署的完整流程。通过使用预训练模型,我们可以在较小的数据集上获得不错的分类效果。Flask框架的轻量级特性使得部署变得简单快捷。在实际应用中,可以根据具体需求进行进一步的优化和改进。

参考资料

  1. MobileNetV3论文:Searching for MobileNetV3
  2. Flask官方文档:https://flask.palletsprojects.com/
  3. PyTorch官方文档:https://pytorch.org/docs/stable/index.html
  4. 百度图片API文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85500.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85500.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/85500.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SCADA技术与市场全景解析

SCADA系统作为工业自动化领域的关键组成部分,成为了工业企业推进数字化转型的有力抓手。本文将重点介绍SCADA系统的发展历程、系统构成及工作原理、发展趋势,分析其行业应用差异,以及与物联网和组态软件的区别,梳理其在不同行业的…

在线教学课程视频AI智能大纲代码与演示

AI根据视频内容自动生成视频大纲,极大地提高了视频内容的管理效率、可访问性和用户体验,是推动视频内容智能化发展的重要一环。AI根据视频内容自动生成视频内容大纲。这种功能,应用场景有哪些? 应用场景: 在线教育平台…

动态WCMP+Flowlet ALB:双引擎驱动智算网络负载均衡

传统网络架构的困境 在 AI 算力爆发的今天,数据中心网络正经历前所未有的流量形态变革。传统 Clos 网络架构依赖逐流 ECMP 均衡算法,其设计逻辑基于 “大量短流” 假设,通过五元组 HASH 实现负载分担。然而 AI 训练场景呈现出鲜明的流量特征…

软件测试题

选择题 1、导致软件缺陷的原因有很多,①—④是可能的原因,其中最主要的原因包括( )。 ①软件需求说明书编写的不全面,不完整,不准确,而且经常更改 ②软件设计说明书 ③软件操作人员的水平 ④开发人员不能很好的…

微信小程序页面容器弹出层

效果图 .JS Page({data: {show: false,duration: 300,position: right,round: false,overlay: true,customStyle: ,overlayStyle: },popup(e) {const position e.currentTarget.dataset.positionlet customStyle let duration this.data.durationswitch(position) {case to…

Excel批量计算时间差

执行以下操作,将自定义格式代码应用到单元格: 选择相应的单元格。在"开始"选项卡上的"数字"组中,单击"常规"框旁边的箭头,然后单击"其他数字格式"。在"设置单元格格式"对话框…

shell脚本--变量

1.变量是什么 2.变量类型 3.动态,静态,强弱类型 4.变量的命名 5.变量的定义和引用 5.1三种变量类型 普通变量 环境变量 局部变量 5.2单引号,双引号,强弱引用 双引号对变量赋值的影响01:59:给变量加双引号&#x…

大模型Text2SQL之在CentOS上使用yum安装与使用MySQL

前言 学习大模型的时候需要一个mysql,原因还是在公司使用电脑的时候不允许按照Docker-Desktop,我的宿主机其实是MAC,我习惯上还是在centsos上面安装,就发现这件过去很简单的事情居然捣鼓了我蛮久,记录一下。 容器环境 我直接安…

机器人大脑的进化:Physical Intelligence如何用“知识隔离“破解VLA模型三大难题

目录 引言:当GPT遇上机器人手臂 第一章:VLM 与 VLA的介绍 VLM (Vision-Language Model) - 视觉语言模型 VLA (Vision-Language Agent) - 视觉语言智能体 VLM和VLA的对比 第二章:VLA模型的进化史 - 从"口述指挥"到"精确控…

LeetCode 662. 二叉树的最大宽度

文章目录 LeetCode 662. 二叉树的最大宽度题目描述思路Golang 代码 LeetCode 662. 二叉树的最大宽度 记录一次刷题的感悟。这道题目是我人生第一次面试的时候的手撕题目,但临场的时候面试官没有为难我,他考察的问题是求二叉树的最大宽度,但是…

【linux】bash脚本中括号问题

在 Bash 脚本里,中括号 [ ] 其实是 test 命令的同义词,[ 是一个命令,] 是该命令的最后一个参数,所以中括号内外的空格会影响命令执行,下面详细说明: 中括号内侧空格 中括号内侧与操作数之间必须有空格&…

Ruoyi(若依)整合websocket实现信息推送功能(消息铃铛)

实现消息推送功能 来了,来了,大家做系统应该是最关心这个功能。 【思路】 需求:对全系统【所有的业务操作】进行消息推送,有【群发】、【私发】功能、处理【消息状态(未读/已读)】,websocket持…

小白的进阶之路系列之十五----人工智能从初步到精通pytorch综合运用的讲解第八部分

torch.nn 究竟是什么? PyTorch 提供了设计精良的模块和类,如 torch.nn、torch.optim、Dataset 和 DataLoader,帮助你创建和训练神经网络。为了充分利用它们的能力并根据你的问题进行定制,你需要真正理解它们到底在做什么。为了帮助你理解这一点,我们将首先在不使用这些模…

JavaScript 数据结构详解

最近在复习JavaScript的基础知识,和第一次学确实有了很不一样的感受,第一次学的比较浅,但是回头再进行学习的时候,发现有很多遗漏的东西,所以今天想分享一下新学到的知识,后面会一点一点补充更新 JavaScrip…

c++面试题(14)------顺时针打印矩阵

操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个元素。 例如: 输入矩阵: [[ 1, 2, 3 ],[ 4, 5, 6 ],[ 7, 8, 9 ] ]输出&…

《Go语言圣经》defer

《Go语言圣经》defer 核心概念:defer语句的执行时机 defer是Go语言的一个关键字,它的作用是:延迟执行一个函数调用,该调用会在包围它的函数返回前一刻执行。 关键点: defer语句会在函数即将返回时执行,…

WEB3 的 WebSocket Provider连接方式

1. 什么是 WebSocket Provider? WebSocket Provider 是 web3.js 中用于通过 WebSocket 协议 与以太坊节点(如 Infura、Geth、Parity)建立持久化连接的通信方式。它允许双向实时数据传输,适用于需要实时监听区块链事件的场景。 核心特点 双向通信:客户端和服务器可以主动…

三国大模型:智能重构下的乱世文明图谱

引言:当赤壁烽烟遇见深度学习 一件动态的《全本三国演义》正通过全息投影技术演绎群雄逐鹿的史诗。这个虚实交融的场景,恰似三国大模型技术的隐喻——以人工智能为纽带,连接起汉末三国的烽火狼烟与数字时代的文明重构。作为人工智能与历史学…

AWS数据库迁移实战:本地MySQL零停机上云方案

一、迁移场景 本地环境&#xff1a;自建MySQL 5.7&#xff08;数据量500GB&#xff09;&#xff0c;业务要求迁移停机时间<5分钟 目标架构&#xff1a; 二、迁移四步法 步骤1&#xff1a;环境准备&#xff08;耗时30分钟&#xff09; 1.1 创建Aurora MySQL # AWS CLI创…

uni-app 安卓 iOS 离线打包参考

App 离线打包 原生工程配置 安卓&#xff1a;【uniapp】uniapp 离线打包安卓应用或者云打包发布 app 步骤&问题记录 iOS&#xff1a;uni-app实现XCode苹果本地离线打包APP