pingmian/2025/9/4 17:59:33/文章来源:https://blog.csdn.net/moonsheeper/article/details/151115872

推荐算法的发展历史是一部从简单规则到复杂智能，从宏观群体推荐到微观个性化精准推荐的演进史。它大致可以分为以下几个阶段：

推荐算法的发展历史是一部从简单规则到复杂智能，从宏观群体推荐到微观个性化精准推荐的演进史。它大致可以分为以下几个阶段：

第一阶段：远古时代 - 非个性化推荐 (1990s中期之前)

在这个阶段，所谓的“推荐”几乎没有任何个性化可言，更像是一个热门排行榜或人工编辑推荐。

核心方法：
- 全局热门推荐：直接推荐给所有人最畅销、点击率最高的商品。例如，书店门口的“畅销书排行榜”。
- 分类热门推荐：按类别推荐热门的商品。例如，“科幻类畅销书排行榜”。
- 人工精选：由编辑、专家等人工挑选并推荐商品，常见于早期内容网站。
特点：实现简单，但完全忽略了个体差异，用户体验单一。

第二阶段：萌芽与奠基 - 协同过滤的诞生 (1990s中期 - 2000s初)

这是个性化推荐算法的起点，标志性思想是协同过滤（Collaborative Filtering, CF） 的提出和应用。

核心里程碑：
- 1992年：Xerox PARC的David Goldberg等人首次提出“协同过滤”概念，用于过滤电子邮件。
- 1994年：MIT的GroupLens研究组将协同过滤应用于新闻过滤，提出了第一个自动化的协同过滤系统。
- 1997年：Amazon发表了关于其 item-to-item 协同过滤技术的论文，并将其成功应用于电商推荐，取得了巨大商业成功，证明了推荐系统的价值。
主要方法：
- 基于用户的协同过滤（User-CF）： “和你口味相似的人也喜欢XXX”。计算用户之间的相似度。
- 基于物品的协同过滤（Item-CF）： “喜欢这个物品的人也喜欢XXX”。计算物品之间的相似度（Amazon的主力算法）。
特点：实现了真正的个性化推荐，但深受冷启动问题（新用户、新物品无法被推荐）和数据稀疏性问题（用户-物品矩阵非常稀疏，难以计算相似度）的困扰。

第三阶段：百花齐放 - 模型化与多元化 (2000s初 - 2010s初)

为了克服协同过滤的缺陷，研究者们引入了更多机器学习模型和数据处理技术。

核心发展：
1. 模型化推荐：
  - 矩阵分解（Matrix Factorization, MF）：尤其是隐语义模型（LFM），如2006年Netflix Prize竞赛中大放异彩的SVD及其变种。它将用户和物品映射到一个低维的潜在空间（latent space），从而挖掘用户和物品的深层隐藏特征，解决了数据稀疏性问题，精度远超传统CF。
2. 内容过滤的融合：
  - 为了解决物品冷启动问题，算法开始结合物品的内容信息（如文本、标签、属性）。例如，为一个新电影提取关键词（导演、演员、类型），推荐给喜欢这些关键词的用户。
3. 逻辑回归（LR）成为排序核心：
  - 在推荐系统的排序阶段，逻辑回归因其简单、高效且易于处理大规模特征的优势，成为预估点击率（CTR）的主流模型。特征工程变得至关重要。
特点：推荐系统从“算法”思维转向“算法+特征工程”思维，效果和稳定性大幅提升。

第四阶段：深度学习时代 - 智能感知与深度建模 (2010s中期 - 至今)

深度学习强大的表示学习和自动特征组合能力，彻底改变了推荐系统的面貌。

核心发展：
1. 深度学习模型的引入：
  - 2016年Google的Wide & Deep模型：这是一个里程碑。它巧妙地将记忆能力（Wide部分，如LR，处理稀疏特征）和泛化能力（Deep部分，DNN，学习深层特征组合）结合，成为后续众多模型的基石。
  - 后续衍生模型：DeepFM、DCN、xDeepFM等模型在Wide & Deep的基础上，更好地实现了自动的高阶特征交叉。
2. 注意力机制与序列建模：
  - 阿里巴巴的DIEN（2019）：使用RNN和注意力机制来模拟用户兴趣的动态演化，而不仅仅是静态的历史行为列表，更能捕捉用户的实时意图。
  - Transformer的应用：将NLP领域的Transformer模型用于用户行为序列建模，成为新的前沿方向。
3. ** embedding技术的全面应用**：
  - 一切皆可Embedding。用户、物品、上下文信息都被映射为低维向量，进行语义化的相似度计算，这是实现深度匹配和语义召回的基础。
4. 多任务学习（MTL）：
  - 使用MMoE等结构，让一个模型同时学习点击率（CTR）、转化率（CVR）、点赞、评论、停留时长等多个目标，平衡用户体验和平台商业目标。
特点：模型结构变得极其复杂，从“特征工程”走向“模型工程”，对算力和数据的要求极高，但效果也达到了前所未有的高度。

第五阶段：当下与未来 - 更大的模型与更广阔的边界 (现在进行时)

生成式推荐系统：利用大语言模型（LLM） 如GPT来理解用户查询的深层意图、生成个性化推荐解释、甚至直接创造和生成推荐内容（例如，生成一个个性化的购物清单或旅行计划）。
强化学习（RL）的应用：将推荐过程视为一个序列决策问题，通过与环境（用户）的交互来学习长期收益最优的推荐策略，而不仅仅是优化下一次点击。
因果推断：消除推荐系统中的偏差（如位置偏差、流行度偏差），更公平地评估物品质量，理解推荐的真正因果效应。
多模态融合：深度融合文本、图像、视频、音频等多种信息进行推荐（例如，通过分析短视频的画面和背景音乐来理解其内容并进行推荐）。
隐私计算：在数据不出域的前提下（如联邦学习）进行联合建模，成为数据安全法规日益严格下的重要方向。

总结：发展脉络

阶段	核心思想	代表性算法/技术	主要解决的问题
1. 非个性化	热度、人工	热门排行榜	基础推荐需求
2. 协同过滤	群体智慧	User-CF, Item-CF	实现个性化
3. 模型化	隐藏特征、特征工程	矩阵分解(SVD), 逻辑回归(LR)	数据稀疏性、精度提升
4. 深度学习	表示学习、自动特征交叉	Wide & Deep, DeepFM, DIEN	复杂模式识别、兴趣演化
5. 前沿探索	生成、推理、多模态	大语言模型(LLM), 强化学习(RL)	深度理解、长期价值、公平性

这个演进过程体现了从“知其然”（CF）到“知其所以然”（MF），再到“感知万物”（深度学习），最终走向“推理与创造”（LLM+RL）的技术飞跃。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/pingmian/95336.shtml
繁体地址，请注明出处：http://hk.pswp.cn/pingmian/95336.shtml
英文地址，请注明出处：http://en.pswp.cn/pingmian/95336.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

企业DevOps的安全与合规关键：三大主流DevOps平台能力对比

企业DevOps的安全与合规关键：三大主流DevOps平台能力对比

在数字化转型的浪潮中，DevOps平台已成为企业加速软件交付、提升协作效率的核心引擎。然而，随着应用范围的扩大，安全漏洞与合规风险也随之凸显。如何平衡速度与安全，实现高效且合规的DevOps流程，已成为企业亟需解决的关…

阅读更多...

pgroll：简化PostgreSQL零停机迁移

pgroll：简化PostgreSQL零停机迁移

pgroll：PostgreSQL零停机迁移的新思路作为后端开发者，我们都遇到过数据库变更的难题。想象一下，你需要在电商大促期间修改用户表结构——传统的ALTER TABLE可能导致锁表，用户下单流程中断，每分钟都是真金白银的损失。p…

阅读更多...

JVM1.8与1.9的区别是什么？

JVM1.8与1.9的区别是什么？

一、核心机制变化类加载器调整 JDK 1.8：使用三种类加载器： 启动类加载器（Bootstrap）：加载核心类库（如 rt.jar）。扩展类加载器（ExtClassLoader）：加载 JAVA_HO…

阅读更多...

CentOS交换区处理

CentOS交换区处理

文章目录前言创建交换文件（推荐）清理旧交换区前言很多刚开始使用 CentOS 的用户都会遇到。1GB 的交换分区在现代应用环境下确实偏小，很容易在内存压力大时导致系统性能下降甚至应用程序被强制终止。关于交换分区的大小，没有一…

阅读更多...

JavaScript原型与原型链：对象的家族传承系统

JavaScript原型与原型链：对象的家族传承系统

文章目录JavaScript原型与原型链：对象的"家族传承"系统 👨👩👧👦引言：为什么需要原型？原型系统三大核心概念概念关系图核心概念表一、原型基础：对象如何"继承"属…

阅读更多...

数据库语法差异对比

数据库语法差异对比

特性MySQLMSSQLOraclepostgresql单行注释--、#（少）------多行注释/* *//* *//* *//* */字符串连接<code>CONCAT(str1,str2)</code>、<code>CONCAT_WS(separator, str1, str2)</code>、CONCAT（str1,str2）(…

阅读更多...

GIS大学课程表都长啥样？几个地信专业的大学一周课程表

GIS大学课程表都长啥样？几个地信专业的大学一周课程表

前几天，有个准大一的同学问：地信大学课程安排都是啥样的？简单的地理学、遥感学课程之类的对准大一的同学们来说太抽象了，有没有更具体一点的？他在新生群里问本校的学长，得到的课表不是这样的：就…

阅读更多...

leetcode 3027. 人员站位的方案数 II 中等

leetcode 3027. 人员站位的方案数 II 中等

给你一个 n x 2 的二维数组 points ，它表示二维平面上的一些点坐标，其中 points[i] [xi, yi] 。我们定义 x 轴的正方向为右 （x 轴递增的方向），x 轴的负方向为左 （x 轴递减的方向）。类似的…

阅读更多...

oracle 从一张表更新到另外一张表的方法（MERGE）

oracle 从一张表更新到另外一张表的方法（MERGE）

之前更新表格经常用 update aaa set (aaa.q,aaa.w) (select bbb.q,bbb.w from bbb where bbb.eaaa.e)的方法后面学习了一个新的方法，MERGE法，这种写法更适合，因为对于空的值可以自定义定义其值，这样写存储过程的时候就不需要频繁…

阅读更多...

Huggingface终于没忍住，OpenCSG坚持开源开放

Huggingface终于没忍住，OpenCSG坚持开源开放

在全球人工智能竞争进入白热化的当下，开源与闭源之路的选择正在成为决定未来格局的关键。当全球最大的AI开源平台Hugging Face终于承认"开源是赢得AI竞赛的关键"，并呼吁美国重新重视开源赛道时，OpenCSG（开放传神&#x…

阅读更多...

计算机网络模型总概述

计算机网络模型总概述

//网络通讯 --- 不同主机之间的通信(进程间通信) 一、概述目前使用的计算机网络模型主要分为两个：OSI七层模型和TCP/IP模型相比OSI七层模型 ，TCP/IP模型更简洁，更实用，因此目前所使用的基本都是TCP/IP模型，已成为…

阅读更多...

HTTPS -＞ HTTP 引起的 307 状态码与HSTS

HTTPS -＞ HTTP 引起的 307 状态码与HSTS

1.应用场景主要用于了解HSTS, 以及如何合理设置, 如正式服和测试服, 开发环境; 摘要：当HTTPS网站返回307状态码临时重定向到HTTP时，会带来安全风险（如中间人攻击和混合内容问题）。 HSTS机制通过强制HTTPS通信可解决此问题&#…

阅读更多...

PortSwigger靶场之DOM XSS in document.write sink using source location.search通关秘籍

PortSwigger靶场之DOM XSS in document.write sink using source location.search通关秘籍

一、靶场描述这个靶场在搜索查询的跟踪功能中，包含一个基于DOM的跨站脚本（DOM-based XSS）漏洞。该漏洞的产生是因为网站使用了一个名为 document.write 的 JavaScript 函数，这个函数会把数据直接写入到页面中。而写入的数据来源于…

阅读更多...

深度学习篇---Pytorch常用优化器

深度学习篇---Pytorch常用优化器

优化器介绍：在 PyTorch 中，优化器（Optimizer）的作用是根据模型参数的梯度来更新参数，以最小化损失函数。下面用通俗易懂的方式介绍几种常用的优化器：1. SGD（随机梯度下降）最基础的优…

阅读更多...

0903 C++类的运算符重载、静态成员与继承

0903 C++类的运算符重载、静态成员与继承

Part 1.梳理思维导图一.运算符重载1.运算符重载的作用使原本只能对基本数据类型生效的运算符，在重载后，满足可以对构造类型数据生效。2.关系运算符重载a.关系运算符种类> > < < !b.分析参数表达式…

阅读更多...

Cloudflare安全规则实用指南：从路径拦截到IP限制的10个经典范例

Cloudflare安全规则实用指南：从路径拦截到IP限制的10个经典范例

前言：在Cloudflare的安全防护体系中，自定义规则是抵御特定威胁的“精准武器”。除了基础的路径拦截，日常运维中还有许多高频场景需要针对性配置。本文将通过10个实用范例，带你掌握Cloudflare规则的灵活用法，覆盖路径防…

阅读更多...

数据结构（时空复杂度）

数据结构（时空复杂度）

目录一、算法复杂度二、时间复杂度 1.不同时间度代码举例三、空间复杂度一、算法复杂度算法复杂度（评估算法优劣一个重要指标）分为时间复杂度和空间复杂度。时间复杂度是指执行算法所需要的计算工作量，而空间复杂度是指执行这个…

阅读更多...

ESXI8多网卡链路聚合

ESXI8多网卡链路聚合

1. 背景测试服务器只有千兆网卡，增加上行带宽，使用两块网卡做链路聚合。 2. 环境 VM ESXI 8.0 华为交换机 S5735S 3. 交换机配置负载均衡方式采用了src-dst-ipTrunk模式采用了手工负载分担（测试了静态LACP，未成功）4.…

阅读更多...

从“人工驱动”到“AI协同”：良策金宝AI如何助力设计院数智化跃迁？

从“人工驱动”到“AI协同”：良策金宝AI如何助力设计院数智化跃迁？

在“双碳”目标驱动下，电力工程项目的数量与复杂度持续攀升。设计院面临“项目多、周期短、人力紧”的三重压力，传统的“人工驱动”模式已难以为继。良策金宝AI，正是这场变革的核心引擎。它以AI驱动数智化服务，为工程设计企业提供…

阅读更多...

vue3 vite 自适应方案

vue3 vite 自适应方案

两种方案： 1 使用 postcss-pxtorem插件 npm install postcss-pxtorem autoprefixer --save-dev # 或 yarn add postcss-pxtorem autoprefixer -D 2、postcss-px-to-viewport npm install postcss-px-to-viewport --save-dev 或 yarn add postcss-px-to-viewport -D …

阅读更多...

最新文章