简介

ESMM(Entire Space Multi-task Model)是2018年阿里巴巴提出的多任务学习模型。基于共享的特征表达和在用户整个行为序列空间上的特征提取实现对CTR、CVR的联合训练

解决的问题

SSB(sample selection bias)

如下图1所示,传统的CVR模型的训练样本是基于点击样本构成的,只是真实展现样本的一部分

图1 SSB

DB(data sparsity)

训练CTR模型的数据量比CTR模型的量级少很多,相对较少的数据量增加了模型训练的难度

解决的方案

针对SSB

方案

在整个用户行为序列空间上建模(Modeling over entire space)

数学表达

如下所示:

(公式1)

其中,y、z分别表示CTR、CVR的label,pCTCVR = p(y=1,z=1|x)、pCTR = p(y=1|x)都是在整个样本空间上建模的,最终得到pCVR

针对DB

方案

共享用户整个行为序列空间上的特征表达(Feature representation transfer),对于CVR网络可以实现从展现但未点击的样本中学习

模型结构和Loss设计

模型结构

图2 ESMM模型结构

其中,CTR、CVR网络共享embedding参数。

Loss

  1. 考虑Loss的时候,考虑pCTCVR、pCTR的交叉熵损失之和,而不单独考虑pCTCVR、pCTR来训练模型然后基于公式(1)计算pCVR。原因在于:
    1. 可以达到联合训练的目的
    2. pCTR是很小的数值,若单独训练则采用除法会带来计算的不稳定,导致pCVR不在[0,1]区间。
  2. 具体的Loss如下所示
(公式2)

其中,l(·)是交叉熵损失函数。

模型效果

数据集

分为Public Datase、Product Dataset,均来自淘宝推荐系统的traffic logs。数据集详情如下:

图3 数据集大小

数据集下载链接:数据集下载链接

各模型相同的参数

  1. 激活函数:ReLU
  2. embedding维度:18维
  3. MLP每层维度:360*200*80*2
  4. adam求解器:beta1 = 0.9,beta2 = 0.999,平滑项=10^(-8)

Public Dataset的模型效果

数据集划分

50%数据训练,50%数据做测试

模型效果

图4 Public Dataset的模型效果

对比CVR、CTCVR结果

  1. CTCVR的计算:pCTCVR = pCTR * pCVR
  2. pCVR:训练上述的每个模型得到的结果
  3. pCTR:基于同一个被独立训练的CTR模型(和BASE模型采用想用的结构和超参)得到

各CVR模型说明

模型样本模型说明
BASE有点击的样本结构为图2的ESMM模型结构中的CVR网络
AMAN所有的展现样本negative sampling strategyand best results are reported with sampling rate searched in {10%, 20%, 50%, 100%}模型对应的文献:One-class collaborative fltering(2008年)
OVERSAMPLING有点击的样本copies positive examples to reduce difficulty of training with sparse data,with sampling rate searched in {2, 3, 5, 10}模型对应的文献:Mining with rarity: a unifying framework(2004年)
UNBIAS有点击的样本fit the truly underlying distribution from observations via rejection sampling模型对应的文献:Bid-aware gradient descent for unbiased learning with censored data in display advertising(2016年)
DIVISION所有的展现样本estimates pCTR and pCTCVR with individually trained CTR and CTCVR networks and calculates pCVR by 公式1
ESMM-NS所有的展现样本a lite version of ESMM without sharing of embedding parameters
ESMM所有的展现样本相比ESMM-NS,有共享的embedding参数

Product Dataset的模型效果

图5 Product Dataset的模型效果

注:各模型说明同Public Dataset的模型效果

结尾

亲爱的读者朋友:感谢您在繁忙中驻足阅读本期内容!您的到来是对我们最大的支持❤️

正如古语所言:"当局者迷,旁观者清"。您独到的见解与客观评价,恰似一盏明灯💡,能帮助我们照亮内容盲区,让未来的创作更加贴近您的需求。

若此文给您带来启发或收获,不妨通过以下方式为彼此搭建一座桥梁: ✨ 点击右上角【点赞】图标,让好内容被更多人看见 ✨ 滑动屏幕【收藏】本篇,便于随时查阅回味 ✨ 在评论区留下您的真知灼见,让我们共同碰撞思维的火花

我始终秉持匠心精神,以键盘为犁铧深耕知识沃土💻,用每一次敲击传递专业价值,不断优化内容呈现形式,力求为您打造沉浸式的阅读盛宴📚。

有任何疑问或建议?评论区就是我们的连心桥!您的每一条留言我都将认真研读,并在24小时内回复解答📝。

愿我们携手同行,在知识的雨林中茁壮成长🌳,共享思想绽放的甘甜果实。下期相遇时,期待看到您智慧的评论与闪亮的点赞身影✨!

万分感谢🙏🙏您的点赞👍👍、收藏⭐🌟、评论💬🗯️、关注❤️💚~ 


自我介绍:一线互联网大厂资深算法研发(工作6年+),4年以上招聘面试官经验(一二面面试官,面试候选人400+),深谙岗位专业知识、技能雷达图,已累计辅导15+求职者顺利入职大中型互联网公司。熟练掌握大模型、NLP、搜索、推荐、数据挖掘算法和优化,提供面试辅导、专业知识入门到进阶辅导等定制化需求等服务,助力您顺利完成学习和求职之旅(有需要者可私信联系) 

友友们,自己的知乎账号为“快乐星球”,定期更新技术文章,敬请关注!   

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913153.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913153.shtml
英文地址,请注明出处:http://en.pswp.cn/news/913153.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

K8S 集群配置踩坑记录

系统版本:Ubuntu 22.04.5-live-server-amd64 K8S 版本:v1.28.2 Containerd 版本: 1.7.27 kubelet logs kuberuntime_sandbox.go:72] "Failed to create sandbox for pod" err"rpc error: code Unknown desc failed to cre…

超滤管使用与操作流程-实验操作013

超滤管使用与操作流程 超滤管(或蛋白浓缩管)是一种重要的实验设备,广泛应用于分离与纯化大分子物质,尤其是蛋白质、多糖和核酸等。其工作原理依赖于超滤技术,通过半透膜对分子进行筛分,精准地将大分子物质…

GitHub已破4.5w star,从“零样本”到“少样本”TTS,5秒克隆声音,冲击传统录音棚!

嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万技术人共享升级秘籍!你是否为录音成本高、声音不灵活、又想为多语言…

【中文核心期刊推荐】《遥感信息》

《遥感信息》(CN:11-5443/P)是一份具有较高学术价值的双月刊期刊,自创刊以来,凭借新颖的选题和广泛的报道范围,兼顾了大众服务和理论深度,深受学术界和广大读者的关注与好评。 该期刊创办于1986…

uniapp微信小程序css中background-image失效问题

项目场景:提示:这里简述项目相关背景:在用uniapp做微信小程序的时候,需要一张背景图,用的是当时做app的时候的框架,但是,在class的样式中background-image失效了,查了后才知道&#…

iOS App无源码安全加固实战:如何对成品IPA实现结构混淆与资源保护

在很多iOS项目交付中,开发者或甲方并不总能拿到应用源码。例如外包项目交付成品包、历史项目维护、或者仅负责分发渠道的中间商,都需要在拿到成品ipa文件后对其进行安全加固。然而传统的源码级混淆方法(如LLVM Obfuscator、Swift Obfuscator&…

Java 中的 ArrayList 和 LinkedList 区别详解(源码级理解)

🚀 Java 中的 ArrayList 和 LinkedList 区别详解(源码级理解) 在日常 Java 开发中,ArrayList 和 LinkedList 是我们经常用到的两种 List 实现。虽然它们都实现了 List 接口,但在底层结构、访问效率、插入/删除操作、扩…

使用OpenLayers调用geoserver发布的wms服务

1.前端vue3调用代码 <template><div><div ref"mapContainer" class"map"></div></div> </template><script setup lang"ts"> import { ref, onMounted } from "vue"; import Map from &quo…

二十七、【测试执行篇】测试计划:前端一键触发测试 实时状态追踪

二十七、【测试执行篇】测试计划:前端一键触发测试 & 实时状态追踪 前言准备工作第一部分:后端 API 确认第二部分:前端实现 - 触发执行与状态轮询第三部分:后端 API 增强第四部分:全面测试总结前言 一个完整的自动化测试流程,从测试用例的创建到报告的生成,最终都需…

60天python训练营打卡day52

学习目标&#xff1a; 60天python训练营打卡 学习内容&#xff1a; DAY 52 神经网络调参指南 知识点回顾&#xff1a; 1.随机种子 2.内参的初始化 3.神经网络调参指南 a.参数的分类 b.调参的顺序 c.各部分参数的调整心得 作业&#xff1a;对于day’41的简单cnn&#xff0c;看…

【Modern C++ Part3】Understand-decltype

条款三&#xff1a;理解decltype decltype是一个怪异的发明。给定一个变量名或者表达式&#xff0c;decltype会告诉你这个变量名或表达式的类型。decltype的返回的类型往往也是你期望的。然而有时候&#xff0c;它提供的结果会使开发者极度抓狂而不得参考其他文献或者在线的Q&…

前端批量请求场景

文章目录 一、批量请求1、Promise.allSettled2、返回值穿透 二、案例1、 批量任务2、缓存优化3、另一种实现方式 一般时候前端都是简单的查询任务&#xff0c;复杂的数据获取都是后台处理好再返回&#xff0c;如果遇到接口流程化处理、数据组装&#xff0c;可以参考一下。 一、…

芊芊妙音:智能变声,玩转声音魔法

在当今丰富多彩的社交和娱乐环境中&#xff0c;声音的魅力正逐渐被更多人发现和利用。无论是线上社交、短视频创作还是直播互动&#xff0c;一个独特而有趣的声音总能让人眼前一亮&#xff0c;甚至成为个人风格的一部分。《芊芊妙音》正是这样一款能够帮助用户轻松实现声音变换…

安防监控视频汇聚平台EasyCVR v3.7.2版云端录像无法在web端播放的原因排查和解决方法

有用户反馈&#xff0c;在使用EasyCVR视频汇聚平台时&#xff0c;发现云端录像无法在Web页面正常播放。为帮助大家高效解决类似困扰&#xff0c;本文将详细剖析排查思路与解决方案。 用户软件版本信息&#xff1a; 问题排查与解决步骤&#xff1a; 1&#xff09;问题复现验证…

vxe-upload vue 实现附件上传、手动批量上传附件的方式

vxe-upload vue 实现附件上传、手动批量上传附件的方式 查看官网&#xff1a;https://vxeui.com 安装 npm install vxe-pc-ui4.6.47// ... import VxeUIAll from vxe-pc-ui import vxe-pc-ui/lib/style.css // ...createApp(App).use(VxeUIAll).mount(#app) // ...上传附件支…

leaflet【十一】地图瓦片路径可视化

前言 在开发调试过程当中&#xff0c;如果引入的是公司内部的Gis地图信息或者一些第三方定制来的Gis地图数据&#xff0c;当某一些地图块数据缺失的时候&#xff0c;要打开F12去一个个找那些链接&#xff08;去找对应的xy与layer&#xff09;失效、那么你可能需要使用以下插件…

ES6从入门到精通:模块化

ES6 模块化基础概念ES6 模块化是 JavaScript 官方标准&#xff0c;通过 import 和 export 语法实现代码拆分与复用。模块化特点包括&#xff1a;每个文件是一个独立模块&#xff0c;作用域隔离。支持静态分析&#xff0c;依赖关系在编译时确定。输出的是值的引用&#xff08;动…

stm32 USART串口协议与外设——江协教程踩坑经验分享

江协stm32学习&#xff1a;9-1~9-3 USART串口协议与外设 一、串口通信基础知识 1、通信类型&#xff1a; 全双工通信&#xff1a;通信双方能够同时进行双向通信。一般有两根通信线&#xff0c;如USART中的TX&#xff08;发送&#xff09;和RX&#xff08;接收&#xff09;线&am…

深度学习中的一些名词

向前传播 forward pass 在机器学习中&#xff0c;输入的feature, 通过预测模型&#xff0c;输出预测值&#xff0c;此过程称之为向前传播&#xff1b; 向后传播 backward pass 为了将预测与真实值的产值减小&#xff0c;需要根据差值&#xff0c;更新模型中的参数&#xff0c;此…

鸿蒙系统(HarmonyOS)应用开发之手势锁屏密码锁(PatternLock)

项目概述 基于鸿蒙&#xff08;OpenHarmony&#xff09;平台开发的手势密码锁应用&#xff0c;旨在为用户提供安全、便捷且具有良好交互体验的身份验证方式。通过手势图案输入&#xff0c;用户可以轻松设置和验证密码&#xff0c;提升设备的安全性和个性化体验。 功能特点 手…