前言

如果你一直在跟着Fanstuck博主的脚步探索AI大模型的相关内容，从最初的大模型Prompt工程解析，DeepSeek全面解析，到实际的私有化大模型开发部署，再到深入NL2SQL、知识图谱大模型和ChatBI等更高阶应用.我是Fanstuck，致力于将复杂的技术知识以易懂的方式传递给读者，热衷于分享最新的行业动向和技术趋势。如果你对大模型的创新应用、AI技术发展以及实际落地实践感兴趣，那么请关注Fanstuck。

1、推荐算法分类

推荐系统的发展历史可以看作是一场技术迭代的缩影。从最早的协同过滤，到后来基于深度学习的方法，再到近几年火热的图神经网络与强化学习，直到今天我们谈论的大模型（LLM）推荐，这条路线背后反映的是行业不断追求更高精度、更强泛化能力以及更好的用户体验的过程。

在这一章里，我们先来回顾一下常见的几类推荐算法，理解它们的原理、优势与不足，同时配合一些实际案例，帮助你从整体上把握推荐系统技术的发展脉络。

1.1基于传统方法的推荐

在互联网早期，用户行为数据相对有限，模型复杂度也无法做得太高。于是，简单直观的推荐方法成了主流。这里面最典型的就是协同过滤和基于内容的推荐。除此之外，还有基于知识的推荐，以及将多种方法融合的混合推荐。

名称	核心思想	典型模型/做法	优点	局限与风险	适用场景
协同过滤（CF）	“物以类聚、人以群分”：利用用户–物品交互矩阵中的相似性做外推	User-KNN / Item-KNN、MF（SVD/ALS/BPR）、item2vec	简单有效、可解释性较强（特别是 Item-CF）	冷启动、数据稀疏、易受噪声影响	老练业务、交互较丰富的场景
基于内容（Content-Based）	比较物品内容与用户画像的相似度	TF-IDF/BM25、特征工程 + 余弦相似度、词向量/句向量	冷启动友好、偏好可迁移	内容表征质量决定上限，易“窄化”	媒体/长文本、属性丰富的品类
基于知识（Knowledge-Based）	注入领域知识与规则，约束与增强推荐	规则库、知识图谱、约束检索	冷启动与合规友好、精准可控	知识获取/维护成本高，多样性受限	强合规/强约束场景（金融/医疗/政企）
混合（Hybrid）	多策略组合、取长补短	加权融合、切换、分区展示、分层（Meta-Level）	综合表现最好、鲁棒	复杂度高、参数调优难	大规模线上业务的主流工程范式

1.1.1 基于协同过滤的推荐

协同过滤（Collaborative Filtering，CF）可能是最广为人知的推荐算法了。它的直觉非常贴近人类社交：如果我和你兴趣相似，那么你喜欢的东西，我大概率也会喜欢。

协同过滤有两种经典形式：

基于用户的协同过滤：寻找一群和目标用户兴趣相似的人，再把他们喜欢的物品推荐给目标用户。
基于物品的协同过滤：找出和用户喜欢过的物品相似的候选物品，再推送给用户。

举个例子。在一个电影网站上，我们收集了用户对电影的打分，构建出一个用户–电影的评分矩阵。如果我们想预测 user5 对《盗梦空间》的喜好，可以先找到和 user5 观影口味最接近的几位用户，看看他们对这部电影的打分，再综合这些打分推测 user5 的偏好。

迷你案例（电影）：构建用户–电影矩阵 → 计算 Item-Item 相似度 → 对目标用户做 Top-N 候选 → 结合近邻权重打分 → 推荐。

计算流程展示：矩阵填充示例，预估user5对 movie1 的评分

步骤:

①数据收集:首先，需要收集用户与电影之间的交互数据，例如用户对电影的评分、浏览记录、购买记录等。

②创建矩阵:根据用户与电影的交互数据，构建一个用户-项目(电影)评分矩阵。

③选择协同滤波算法，此处默认选择与用户的协同过滤，该算法通过计算用户之间的相似度

④来找到与目标用户相似的其他用户，然后根据这些相似用户的喜好为目标用户推荐电影。

这种方法实现简单，而且在数据相对稠密的情况下表现很不错。但它的问题也很明显：

新用户、新物品没有数据时，系统很难做出推荐，这就是所谓的冷启动问题；
评分矩阵往往非常稀疏，很多地方都是空的，导致算法难以找到可靠的相似性。

为了缓解稀疏性，人们后来引入了矩阵分解（Matrix Factorization）方法，把用户和物品都映射到一个低维向量空间里，用向量点积来预测用户的兴趣。这类方法在 Netflix Prize 比赛中大放异彩，也推动了工业界的广泛应用。

1.1.2 基于内容的推荐

如果协同过滤强调的是“人以群分”，那么基于内容的推荐强调的就是“物以类聚”。它关注的是物品本身的特征，而不是依赖大量的用户行为。

比如，我们有一部电影的简介：“一支探索队进入虫洞，寻找人类的新家园。”如果用户之前喜欢过《星际穿越》，那么这部电影很可能也会吸引他。这里的关键在于如何把“电影的内容”转化为可计算的特征向量。

常见做法是对文本类特征使用 TF-IDF、BM25 或词向量来表示，对离散属性（类型、导演、演员）做独热编码，对数值属性（时长、评分）直接使用。最后，通过余弦相似度计算用户偏好和候选物品之间的距离。

基于内容的推荐在冷启动时比协同过滤更有优势，因为它不依赖用户行为。但它也容易陷入“越推越窄”的陷阱：如果你看了几部科幻片，系统就会一直推荐科幻，难以拓展到多样化的兴趣。

比如构建一个电影推荐系统，首先需要准备电影数据，这里假设有一个包含电影信息的 DataFrame，其中包括电影的标题、类型、导演、演员以及剧情简介等字段。

根据用户历史观看的电影(如“星际穿越”和“盗梦空间”)，系统推荐了具有相似特征(如科幻类型、相同导演等)的电影。在这个例子中，BM25 算法有效地计算了用户偏好与候选电影之间的相似度，并为用户推荐了最相关的电影。

流程: ①特征提取:使用文本处理技术(如分词、去停用词等)对电影的剧情简介进行预处理，并构建词袋模型或 TF-IDF模型来表示电影的内容特征。

②用户偏好学习:根据用户历史观看的电影，提取这些电影的内容特征，并计算用户偏好的特征向量。例如，可以将用户观看过的电影的特征向量求平均作为用户的偏好向量

③相似度计算:使用余弦相似度、BM25 等算法计算用户偏好向量与候选电影特征向量之间的相似度。

1.1.3 基于知识/混合的推荐算法

除了协同过滤和内容推荐，还有一种方法是基于知识的推荐。它常见于强约束领域，例如医疗或金融。在这些场景里，推荐结果不仅要符合用户偏好，还必须满足一系列严格的业务规则。比如，在金融推荐中，用户的资质、风险等级、合规要求，都会影响能不能推荐某个理财产品。

工业界更常用的是混合推荐。这是因为单一方法往往有局限，而混合能取长补短。举例来说，电商网站可能会同时展示“基于内容的个性化推荐”、“热门商品推荐”、“知识规则约束下的必推品”，并通过加权或分区的方式综合展示给用户。像亚马逊、当当这样的大型平台，几乎都是混合推荐的典型代表。

1.2 基于深度学习的推荐

随着深度学习的兴起，推荐系统也逐渐进入“深度建模”的阶段。深度学习的优势在于能够自动学习复杂的特征表示和交互关系，而不需要人工设计大量特征。

例如，DSSM、YouTube DNN、双塔模型等架构擅长处理大规模向量召回；Wide&Deep、DeepFM类模型可以同时捕捉特征的记忆性与泛化性；DIN、DIEN则通过注意力机制对用户的行为序列进行建模，能够理解用户兴趣的动态变化。

这些模型大幅提升了推荐的精度，让系统能够更准确地捕捉用户的细粒度兴趣。不过，它们对算力和数据规模的要求也更高，因此更适合头部平台。

1.3基于图的推荐

有些场景下，用户和物品之间的关系本质上是一张复杂的网络。比如，在知识图谱中，用户、物品、属性、标签都可以看作节点，而交互就是连接它们的边。推荐的任务就是在图上挖掘潜在的连接。

典型方法包括 PersonalRank（类似 PageRank，从用户节点出发迭代传播权重），以及 DeepWalk / node2vec 这样的图嵌入方法（通过随机游走生成节点序列，再用 Word2Vec 把节点表示成向量）。近年来，图神经网络（GNN）也逐渐应用到推荐中，比如 LightGCN 就通过层次聚合邻居节点的信息，捕捉更复杂的兴趣关系。