PDF 文档的版式特性使其适用于输出不可变格式的报告与合同。但若要在此类文档中插入或修改文本,常规方式难以实现。借助Python,我们可以高效地向 PDF 添加文本,实现从文档生成到内容管理的自动化流程。

本文将从以下方面介绍Python实现PDF中文本的添加:

文章目录

    • 新建PDF并添加段落文本
    • 向现有PDF中插入文本内容
    • 复杂格式设置:添加透明旋转水印文本
    • 总结


本文使用的方法需要用到免费的Free Spire.PDF for Python,可通过pip安装:

pip install spire.pdf.free

新建PDF并添加段落文本

在构建系统报告或生成模板文档时,通常需要从空白页插入一段段文本,保持排版一致性。

from spire.pdf import PdfDocument, PdfTrueTypeFont, PdfFontStyle, PdfSolidBrush, PdfRGBColor, PointF, RectangleF, \PdfStringFormat, PdfTextAlignment, PdfVerticalAlignment# 创建新的PDF文档并添加页面
pdf = PdfDocument()
page = pdf.Pages.Add()# 待插入的文本内容
text = ("The purpose of this document is to provide an overview of the company’s financial highlights for the fiscal year 2024. ""It includes revenue trends, operational costs, and net income summaries. ""The following sections will outline each metric in more detail.")# 设置字体、画刷(颜色)和排版区域
font = PdfTrueTypeFont("Arial", 14.0, PdfFontStyle.Regular, True)
brush = PdfSolidBrush(PdfRGBColor(0, 0, 0))  # 黑色文本
layout_area = RectangleF(50.0, 50.0, page.GetClientSize().Width - 100.0, page.GetClientSize().Height)
string_format = PdfStringFormat(PdfTextAlignment.Left, PdfVerticalAlignment.Top)# 添加文字内容
page.Canvas.DrawString(text, font, brush, layout_area, string_format, False)# 保存并关闭
pdf.SaveToFile("output/new.pdf")
pdf.Close()

📌 技术细节说明:

  • PdfTrueTypeFont 可嵌入外部字体文件,适用于需要控制字体兼容性的场景;
  • RectangleF 定义文本区域边界(支持自定义段落框);
  • DrawString() 支持超出区域自动换行;
  • 使用 PdfStringFormat 设定水平方向与垂直方向的对齐方式。

生成的PDF文档:
Python新建PDF并插入文本


向现有PDF中插入文本内容

当你已有一份PDF文件,但希望在某一页添加标记或文字说明,例如审批标语、状态说明等,可以使用如下方式:

from spire.pdf import PdfDocument, PdfFontStyle, PdfSolidBrush, PdfRGBColor, PointF, PdfFont, PdfFontFamily# 加载已有PDF文档
pdf = PdfDocument()
pdf.LoadFromFile("PDF.pdf")
page = pdf.Pages[0]# 设置字体、颜色和插入位置
font = PdfFont(PdfFontFamily.TimesRoman, 12.0, PdfFontStyle.Bold)
brush = PdfSolidBrush(PdfRGBColor(0, 128, 0))  # 深绿色
location = PointF(130.0, 90.0)# 插入文本
page.Canvas.DrawString("Verified by QA Department", font, brush, location)# 保存结果
pdf.SaveToFile("output/ModifiedPDF.pdf")
pdf.Close()

📌 技术细节说明:

  • PdfFontFamily.TimesRoman 属于 PDF 标准内置字体(无需嵌入);
  • 坐标 PointF(x, y) 单位为磅(1 pt ≈ 0.3528 mm),以页面左上角为 (0,0);
  • 无需设置区域框时,适用于短文本、标签插入、动态盖章等场景。

修改的PDF文档:
Python载入PDF插入文本


复杂格式设置:添加透明旋转水印文本

在文档审阅或内部版本发布场景中,常见的做法是添加一个带透明度与旋转角度的水印文字,以提示机密性或防止误传播。Spire.PDF 提供了画布状态保存、旋转、透明度控制等接口,可用于实现这种复杂的格式需求。

from spire.pdf import PdfDocument, PdfTrueTypeFont, PdfFontStyle, PdfSolidBrush, PdfRGBColor, PointF
from spire.pdf.common import Color# 加载已有PDF文档
pdf = PdfDocument()
pdf.LoadFromFile("input1.pdf")
page = pdf.Pages[0]# 设置水印文本内容
text = "Internal Use Only"# 设置字体样式与大小
font = PdfTrueTypeFont("Arial", 40.0, PdfFontStyle.Bold, True)# 设置画刷颜色为深红色
brush = PdfSolidBrush(PdfRGBColor(Color.get_DarkRed()))# 测量文本大小以便居中放置
size = font.MeasureString(text)
x = (page.Canvas.ClientSize.Width - size.Width) / 2
y = (page.Canvas.ClientSize.Height - size.Height) / 2# 保存当前画布状态
state = page.Canvas.Save()# 设置透明度
page.Canvas.SetTransparency(0.3)# 平移至文本中心位置
page.Canvas.TranslateTransform(x + size.Width / 2, y + size.Height / 2)# 旋转文本(-45度斜着显示)
page.Canvas.RotateTransform(-45.0)# 绘制文本水印(左上角为起始点,因此需偏移)
page.Canvas.DrawString(text, font, brush, PointF(-size.Width / 2, -size.Height / 2))# 恢复画布状态
page.Canvas.Restore(state)# 保存文档
pdf.SaveToFile("output/with_watermark.pdf")
pdf.Close()

📌 技术细节说明:

  • 使用 SetTransparency(0.3) 设置文本透明度,增强水印效果但不遮挡内容;
  • TranslateTransform() 将画布原点移动至文本中心;
  • RotateTransform(-45) 实现对角线旋转,常用于“CONFIDENTIAL”或“DRAFT”类水印;
  • 水印文本使用 DrawString() 绘制,PointF(-size.Width / 2, -size.Height / 2) 保证以中心为参考点;
  • 通过 Canvas.Save()Canvas.Restore() 管理局部画布状态,避免影响页面中其他元素。

修改后的PDF文档:
Python插入文本到PDF并精确控制位置和格式


总结

通过 Spire.PDF for Python,你可以使用简洁的 Python 代码在 PDF 中添加各类文本,功能包括:

功能项方法与说明
✅ 从零创建文档PdfDocument.Pages.Add() + DrawString()
✅ 插入文本到现有文档LoadFromFile() + PointF 定位文本插入点
✅ 控制排版样式使用 RectangleF + PdfStringFormat 控制对齐与区域
✅ 多行文本支持文本中添加 \n,自动换行渲染
✅ 字体与颜色控制支持 TrueType标准字体,自定义颜色 RGB

这些操作覆盖了 PDF 文本添加的主要应用场景,从文档批量生成到人工标注支持,适合用于自动归档、审批流程、内容输出等业务场景。


📚 更多PDF编辑教程,请访问:
Spire.PDF for Python 教程中心

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/89085.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/89085.shtml
英文地址,请注明出处:http://en.pswp.cn/web/89085.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Quick API:赋能能源行业,化解数据痛点

随着全球能源结构的转型和数字化的深入推进,能源行业正面临前所未有的机遇与挑战。海量的实时数据、复杂的业务系统、以及对数据安全和高效利用的迫切需求,都成为了能源企业在数字化转型道路上的核心痛点。本文将深入探讨麦聪Quick API如何凭借其独特优势…

Google Chrome V8< 13.6.86 类型混淆漏洞

【高危】Google Chrome V8< 13.6.86 类型混淆漏洞 漏洞描述 Google Chrome 是美国谷歌&#xff08;Google&#xff09;公司的一款Web浏览器&#xff0c;V8 是 Google 开发的高性能开源 JavaScript 和 WebAssembly 引擎&#xff0c;广泛应用于 Chrome 浏览器和 Node.js 等环…

力扣经典算法篇-23-环形链表(哈希映射法,快慢指针法)

1、题干 给你一个链表的头节点 head &#xff0c;判断链表中是否有环。 如果链表中有某个节点&#xff0c;可以通过连续跟踪 next 指针再次到达&#xff0c;则链表中存在环。 为了表示给定链表中的环&#xff0c;评测系统内部使用整数 pos 来表示链表尾连接到链表中的位置&…

HarmonyOS DevEco Studio 小技巧 42 - 鸿蒙单向数据流

在鸿蒙应用开发中&#xff0c;状态管理是构建响应式界面的核心支柱&#xff0c;而 单向数据流&#xff08;Unidirectional Data Flow, UDF&#xff09;作为鸿蒙架构的重要设计原则&#xff0c;贯穿于组件通信、状态更新和界面渲染的全流程。本文将结合鸿蒙 ArkUI 框架特性&…

【LeetCode 3136. 有效单词】解析

目录LeetCode中国站原文原始题目题目描述示例 1&#xff1a;示例 2&#xff1a;示例 3&#xff1a;提示&#xff1a;讲解化繁为简&#xff1a;如何优雅地“盘”逻辑判断题第一部分&#xff1a;算法思想 —— “清单核对”与“一票否决”第二部分&#xff1a;代码实现 —— 清晰…

前端面试专栏-算法篇:24. 算法时间与空间复杂度分析

&#x1f525; 欢迎来到前端面试通关指南专栏&#xff01;从js精讲到框架到实战&#xff0c;渐进系统化学习&#xff0c;坚持解锁新技能&#xff0c;祝你轻松拿下心仪offer。 前端面试通关指南专栏主页 前端面试专栏规划详情 算法时间与空间复杂度分析&#xff1a;从理论到实践…

bash中||与的区别

在 Bash 中&#xff0c;|| 和 && 是两种常用的逻辑操作符&#xff0c;用于控制命令的执行流程。它们的核心区别如下&#xff1a;1. ||&#xff08;逻辑 OR&#xff09; 作用&#xff1a;如果前一个命令失败&#xff08;返回非零退出码&#xff09;&#xff0c;则执行后…

OpenCV实现感知哈希(Perceptual Hash)算法的类cv::img_hash::PHash

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 PHash是OpenCV中实现感知哈希&#xff08;Perceptual Hash&#xff09;算法的类。该算法用于快速比较图像的视觉相似性。它将图像压缩为一个简短的…

数据库迁移人大金仓数据库

迁移前的准备工作 安装官方的kdts和KStudio工具 方案说明 一、数据库迁移&#xff1a;可以使用kdts进行数据库的按照先迁移表结构、后数据的顺序迁移&#xff08;kdts的使用可以参考官方文档&#xff09; 其他参考文档 人大金仓官网&#xff1a;https://download.kingbase…

uniapp 微信小程序Vue3项目使用内置组件movable-area封装悬浮可拖拽按钮(拖拽结束时自动吸附到最近的屏幕边缘)

一、最终效果 二、具体详情请看movable-area与movable-view官方文档说明 三、参数配置 1、代码示例 <TFab title"新建订单" click"addOrder" /> // title:表按钮文案 // addOrder:点击按钮事件四、组件源码 <template><movable-area cl…

linux kernel为什么要用IS_ERR()宏来判断指针合法性?

在 Linux 内核中&#xff0c;IS_ERR() 宏的设计与内核的错误处理机制和指针编码规范密切相关&#xff0c;主要用于判断一个“可能携带错误码的指针”是否代表异常状态。其核心目的是解决内核中指针返回值与错误码的统一表示问题。以下从技术背景、设计逻辑和实际场景三个维度详…

Cookie与Session:Web开发核心差异详解

理解 Cookie 和 Session 的区别对于 Web 开发至关重要,它们虽然经常一起使用,但扮演着不同的角色。核心区别在于: Cookie:存储在客户端(用户的浏览器)的数据片段。 Session:存储在服务器端的数据结构,用于跟踪特定用户的状态。 下面是详细的对比: 特性CookieSession…

【相干、相参】 雷电名词溯源

〇、废话因缘 最近某些国产的微波制造公司总是提到一个概念【相干】【相参】【严格相参】等等概念层出不穷&#xff0c;让人苦恼。 一、这玩意还是英文溯源吧 这几个概念都聚焦在一个单词【Coherence】&#xff1b;所以就是说两个波形之间有某种联系&#xff0c;不一定就是完全…

MYSQL练习2

一、对mydb11_stu库进行查询步骤1.创建mydb11_stu库并使用2.创建score表和student表3.向两张表插入数据student表&#xff1a;score表&#xff1a;4.完成查询&#xff08;1&#xff09;分别查询student表和score表的所有记录&#xff08;2&#xff09;查询student表的第2小到5条…

Spring Boot全局异常处理:打造坚如磐石的应用防线

引言在当今的软件开发领域&#xff0c;随着业务的日益复杂和系统规模的不断扩大&#xff0c;Spring Boot 已成为 Java 开发中备受青睐的框架。它以其强大的功能、便捷的配置和快速的开发体验&#xff0c;帮助开发者们高效地构建各种应用程序。在 Spring Boot 应用的开发过程中&…

药品挂网价、药品集采价格、药品上市价格一键查询!

相信许多人在查询药品价格时感到无从下手&#xff0c;那是因为对药品定价机制和标准的不了解&#xff0c;医院及药店的药品价格查询可通过笔者之前的文章进行了解&#xff1a;如何查询药品的价格&#xff08;医院&药店&乡镇卫生院&#xff09;&#xff1f; 而今天笔者要…

【iOS】方法与消息底层分析

目录 前言 方法的本质 向不同对象发送消息 发送实例方法 发送类方法 对象调用方法 实际执行是父类 向父类发送类方法 消息查找流程 开始查找 快速查找流程 慢速查找流程 动态方法决议 应用场景 优化方案 消息转发机制 快速转发流程 应用场景 慢速转发流程 应…

如何通过 WebSocket 接口订阅实时外汇行情数据(PHP 示例)

步骤 1&#xff1a;准备工作确保已安装 PHP 和 Composer安装 WebSocket 客户端库&#xff1a;composer require textalk/websocket步骤 2&#xff1a;编写代码订阅行情以下是最简可运行的 PHP 示例&#xff0c;订阅 EUR/USD 的 1分钟K线数据&#xff1a;<?phprequire vendo…

第十八篇 数据清洗:Python智能筛选与统计:从海量Excel数据中秒级挖掘,辅助决策!你的数据分析利器!

Excel 数据挖掘Excel筛选复杂&#xff0c;统计耗时&#xff0c;无法快速挖掘数据价值1.数据筛选核心&#xff1a;df.loc与df.iloc&#xff0c;精准定位你想要的数据1.1基于条件筛选&#xff1a;过滤数据中的不恰当因素1.2 多条件组合筛选&#xff1a;精确锁定目标数据1.3字符串…

小木的机器学习日记——KNN

核心知识点总结与星级排序我为你梳理了这节课的精髓&#xff0c;并按照重要性进行了星级评定&#xff08;★★★★★为最高&#xff09;。★★★★★ 核心思想&#xff1a;回归 (Regression) 到底是什么&#xff1f;是否关键&#xff1a;是必须了解&#xff1a;是必须记住&…