PEFT 模型
若你使用 SFTTrainer 类进行训练(第 5 课将详细介绍),仅配置信息可能就足够了 —— 该类会在底层自动完成适配器(adapters)与基础模型的关联工作。
不过目前,我们选择手动完成这一操作,以便更深入理解模型是如何被实际修改的。这个过程非常简单:我们只需调用get_peft_model()函数,并传入以下参数即可:
基础(已预处理好的)模型
LoRA 配置(LoRA 全称为 Low-Rank Adaptation,即低秩适应,是一种常用的 PEFT 技术)
(可选参数)为适配器指定的名称(后续你可能需要在不同适配器之间切换,因此给它们起合适的名称是个不错的做法)
config = LoraConfig(
r=8,
lora_alpha=16,
lora_dropout=0.05