python实现提取图片中的文字,使用PaddleOCR识别最精准,因为只需要识别小尺寸图片,速度在一秒钟左右,对于要应用的项目可以接受。缺点是项目打包有将近600M,压缩后也有将近200M。Tesseract虽然速度快,占用空间小,但是对艺术字体识别精度极差,所以排除使用。

        一个提取文字的极简需求,代码只有几十行。前后使用了三种方法,外加使用了PaddleOCR的三个版本,折腾好几天,终于可以了。打包后600M的空间真的惊到我了。

        另使用PaddleOCR旧版本是因为使用方便,稳定,参考资料多。

开发环境版本:

        1.python3.12.10

        2.paddle2.6.0

        3.PaddleOCR2.8.0

一、生成spec文件,不介绍。

二、修改spec文件内容,仅展示修改部分

a = Analysis(['PaddleOCRTest.py'],pathex=['E:\\Programs\\python\\pao\\.venv\\Lib\\site-packages','E:\\Programs\\python\\pao\\.venv\\Lib\\site-packages\\paddle\\libs'],binaries=[('E:\\Programs\\python\\pao\\.venv\\Lib\\site-packages\\paddle\\libs','.')],datas=[('E:\\Programs\\python\\pao\\.venv\\Lib\\site-packages\\paddleocr\\ppocr', 'paddleocr\\ppocr'),('E:\\Programs\\python\\pao\\.venv\\Lib\\site-packages\\paddleocr\\tools', 'paddleocr\\tools'),('E:\\Programs\\python\\pao\\.venv\\Lib\\site-packages\\paddleocr\\ppstructure', 'paddleocr\\ppstructure')],hiddenimports=['shapely.geometry','pyclipper','skimage', 'skimage.morphology', 'imgaug', 'lmdb'],hookspath=[],hooksconfig={},runtime_hooks=[],excludes=[],win_no_prefer_redirects=False,win_private_assemblies=False,noarchive=False,optimize=0,
)

三、遇到的问题:

        1.提示:unhandledexception: cannot import name 'imaging' from 'PlL'

                解决方法:到.venv\Lib\site-packages目录下复制PIL文件夹到打包后的_internal文件夹

        2.提示:ModuleNotFoundError: No module named 'XXX'

                解决方法:将模块名称'XXX'添加到spec文件的hiddenimports内,然后重新打包,直到不弹出该类型错误为止。

参考文章:

        Pyinstaller 打包 PaddleOcr + PyQt5 项目的打包过程、常见问题及解决方法_paddleocr打包太难了-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/97244.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/97244.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/97244.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nginx的主要配置文件nginx.conf详细解读——及其不间断重启nginx服务等操作

一、Nginx的配置文件nginx.conf解析 1.1、查看现有已安装的Nginx版本及其编译配置参数等信息 查看现在已有使用的Nginx版本及其编译配置参数等信息序号安装编译Nginx的方式查看现在已有的Nginx版本及其编译配置参数信息方法1使用【yum install nginx -y】命令安装的Nginx #查看…

可改善能源利用水平、削减碳排放总量,并为可再生能源规模化发展提供有力支撑的智慧能源开源了

一、平台简介 AI 视频监控平台是一款功能强大且操作便捷的实时算法视频监控系统。其核心愿景在于打破各大芯片厂商间的技术壁垒,省去繁琐重复的适配流程,实现芯片、算法与应用的全流程协同组合 —— 这一创新可帮助企业级应用降低约 95% 的开发成本。同…

“上门做饭”平台的核心技术栈与运营壁垒是什么?

上门做饭会彻底颠覆外卖行业,成为下一个万亿级风口吗?答案可能出乎你的意料——不会。但这背后,藏着一个更值得关注的真相。前段时间,杭州上门做饭姑娘的新闻刷屏全网:一天接5-6单,每单最低88元。很多人第一…

企业内网与互联网网络安全改造升级深度解析

在信息化时代,企业内网和互联网的安全性直接影响着业务的稳定性和数据的保密性。然而,随着网络威胁的不断升级,传统的网络安全防护手段已难以满足现代企业的需求。为了应对复杂多变的安全挑战,构建“边界清晰、可管可控、多层防御…

参数模板优化配置指南:从基础到进阶的完整解决方案

在数字化运营时代,参数模板优化配置已成为提升系统性能的关键环节。本文将深入解析参数配置的核心逻辑,从基础概念到高级调优技巧,帮助技术人员构建高效稳定的运行环境。我们将重点探讨参数模板的标准化管理方法,以及如何通过精细…

Ubuntu 22.04 中安装 ROS2 Humble

1.4.1前置配置 语言环境支持 UTF-8: sudo apt update && sudo apt install locales sudo locale-gen en_US en_US.UTF-8 sudo update-locale LC_ALL=en_US.UTF-8 LANG=en_US.UTF-8 export LANG=en_US.UTF-8 启用 Universe 仓库: sudo apt install software-properti…

Python学习-day1

Python学习网站 廖雪峰的官方网站 Python教程 菜鸟教程 Phtyon3教程 W3school Python教程 简明教程 Python教程 牛客网 Python3教程 Python学习网 Python123 Python官网 Python官方教程中文版 Python在线工具 菜鸟工具 Python3在线运行 W3chool在线编译 Python3在线…

为什么外贸企业管理需要外贸CRM系统

CRM(Customer Relationship Management)系统,即客户关系管理软件,是指利用软件、硬件和网络技术,为企业建立一个客户信息收集、管理、分析和利用的信息系统。为什么外贸企业需要外贸CRM管理系统?传统的客户…

Qt基础_xiaozuo

1.Qt基础Qt三大机制&#xff1a;对象树&#xff0c;信号和槽&#xff0c;事件 特殊类的名词&#xff1a;窗口&#xff0c;组件&#xff0c;控件 2.标准IO #include <QDebug>int main(int argc, char *argv[]) {qDebug() << "字符串&#xff1a;" <&l…

解密PCI Express:现代计算机的“高速公路“是如何设计的?

解密PCI Express&#xff1a;现代计算机的"高速公路"是如何设计的&#xff1f; 当你点击鼠标打开一个大型游戏时&#xff0c;数据是如何从固态硬盘飞速传输到显卡的&#xff1f;这背后离不开一个关键技术的支持——PCI Express。 在现代计算机系统中&#xff0c;各种…

软件安装教程(二):Pycharm安装与配置(Windows)

文章目录前言一、准备工作&#xff08;安装前要求&#xff09;二、下载与安装 PyCharm步骤 1&#xff1a;访问 PyCharm 官网步骤 2&#xff1a;运行安装程序步骤 3&#xff1a;完成安装并启动三、首次启动与配置四、创建项目与配置虚拟环境创建新项目配置虚拟环境五、安装必要的…

Java全栈开发实战:从基础到微服务的深度探索

Java全栈开发实战&#xff1a;从基础到微服务的深度探索 一、面试开场 面试官&#xff08;专业且亲切&#xff09;&#xff1a; 你好&#xff0c;很高兴见到你。我是这次面试的负责人&#xff0c;接下来我们会围绕你的技术背景和项目经验进行一些深入的交流。我们希望了解你在实…

Redis搭建哨兵模式一主两从三哨兵

Redis搭建哨兵模式一主两从三哨兵 目录 Redis搭建哨兵模式一主两从三哨兵 一、Redis哨兵模式 1. 哨兵模式原理&#xff1a; 2. 哨兵的作用&#xff1a; 3.哨兵的结构 4.故障转移机制 故障转移过程如下&#xff1a; 主节点的选举条件&#xff1a; 二、节点规划 三、实…

用 C++ 创建单向链表 forward list

文章目录前言1. 源码 forward_list.hpp2. 使用示例前言 用 C 创建了一个单向链表&#xff0c;用于练习使用现代 C 的特性&#xff0c;包括 3 点&#xff1a; 对于容器&#xff0c;使用 std::initializer_list 作为参数创建构造函数。 C Core Guidelines 中&#xff0c;推荐使…

[肥用云计算] Serverless 多环境配置

前言 在 Serverless 应用开发中&#xff0c;多环境配置是一个绕不开的话题。从开发、测试到生产&#xff0c;每个环境都有其特定的配置需求。阿里云 Serverless Devs 虽然提供了官方的 env 命令来管理多环境&#xff0c;但在实际使用中&#xff0c;我发现官方方案存在一些局限…

LeetCode算法日记 - Day 25: 数组中的第K个最大元素、库存管理III

目录 1 数组中的第K个最大元素 1.1 题目解析 1.2 解法 1.3 代码实现 2. 库存管理III 2.1 题目解析 2.2 解法 2.3 代码实现 1 数组中的第K个最大元素 215. 数组中的第K个最大元素 - 力扣&#xff08;LeetCode&#xff09; 给定整数数组 nums 和整数 k&#xff0c;请返…

10分钟快速搭建 SkyWalking 服务

从 0 开始入门 SkyWalking&#xff0c;搭建 SkyWalking 服务&#xff0c;并接入 Java 项目中实现分布式链路追踪。 Tags 目录&#xff1a; 1. 概述2. 搭建 SkyWalking 单机环境3. 搭建 SkyWalking 集群环境4. 告警5. 注意事项6. Spring Boot 使用示例 1. 概述 1.1 概念 …

IDEA之GO语言开发

最近因为接到了需求&#xff0c;说是先把目前公司的JAVA服务慢慢替换成GO语言&#xff0c;于是去了解了一下。 但在开发之前&#xff0c;因为用习惯了IDEA&#xff0c;就想着能不能在IDEA上进行开发&#xff0c;结果真让我找到了。 作为学习记录一下 注意&#xff1a;基于IDEA…

rapid_table v3.0.0发布了

更新日志 rapid_table v3.0.0 主要更新是支持 batch 推理&#xff0c;模型并没有升级哈&#xff01; 因为版本号是根据语义化版本号来走的&#xff0c;这次更改了接口的返回值。因此从 v2.0.3 升级到了 v3.0.0。 返回值具体变化如下&#xff1a; # v2.0.3 class RapidTableO…

若依微服务一键部署(RuoYi-Cloud):Nacos/Redis/MySQL + Gateway + Robot 接入(踩坑与修复全记录)

本文记录我把 高仙&#xff08;Gaussian&#xff09;机器人对接项目 从“本机能跑”迁到 Docker 一键部署 的全过程&#xff1a; 包含 四个后端服务&#xff08;gateway/auth/system/robot&#xff09;、前端 Nginx、MySQL/Redis、Nacos 配置中心、Sentinel 控制台 的改造要点、…