这就是推荐系统――核心技术原理与企业应用

编号:: wx1202882228

销售价:: ￥93.96; (市场价: ~~￥108.00~~)

赠送积分:: 94

数量:: 件

商品介绍
商品参数
商品评论
商品咨询

商品介绍

"多个大规模工业级推荐系统的核心研发经验总结
囊括推荐系统的基础框架、核心技术和前沿发展
亮点一：接近来自于工业化实践，内容按照实际推荐系统的模块划分：内容理解、用户画像、召回、排序、重排等，其他书没有这样写的。
亮点二：内容全面系统但精炼，全书是作者根据实践总结，没有大面积理论讲解，只讲基础框架、核心技术和前沿发展。
亮点三：囊括当下热门前沿技术，包括强化学习、因果推断、端上智能，以及ChatGPT时代的推荐系统未来发展描述，对当下的技术人员很有指导意义。
亮点四：四位作者均是来自一线大厂的工程师，长期在工业界从事推荐算法的相关应用研究，本书的内容融入了作者对推荐算法的思考、体会及实战经验。
亮点五：此书不仅具有全局视野，体系完善，而且生动翔实，细节拉满。不管你是小白还是推荐系统的从业者，阅读此书都会让你受益匪浅。"

推荐系统作为近年来非常热门的AI技术落地场景，已广泛应用于各行业的互联网应用，从衣食住行到娱乐消费，以及无处不在的广告，背后都依赖推荐系统的决策。本书贴合工业级推荐系统，以推荐系统的整体技术框架为切入点，深入剖析推荐系统中的内容理解、用户画像、召回、排序、重排等核心模块，介绍每个模块的核心技术和业界应用，并展开介绍了推荐冷启动、推荐偏置与消偏等常见问题和解决方案。此外，还对当前推荐系统领域的热门前沿技术进行了介绍，包括强化学习、因果推断、端上智能等。

"胡澜涛
毕业于清华大学计算机系，快手推荐算法技术总监。曾任字节跳动高级算法工程师，腾讯高级研究员。在推荐系统领域有丰富的实践经验，负责过包括TikTok、快手、微信看一看在内的多个大规模工业级推荐系统的核心研发工作。主要研究方向为推荐系统，发表相关领域的学术论文6篇，拥有专利5项。

李玥亭
毕业于大连理工大学计算机专业。曾先后就职于百度、小米等公司，参与百度凤巢广告CTR预估模型的研发，负责小米音乐、阅读、应用商店、游戏中心等多个产品推荐服务从0到1的搭建，在搜索、广告、推荐领域有丰富的实战经验。目前转战智能家居领域，探索智能感知、智能决策等AI技术在新场景的落地。

崔光范
毕业于中国科学院软件研究所，爱奇艺助理研究员，负责短视频信息流推荐业务。曾任小米推荐算法工程师，负责应用商店、游戏中心、有品等业务的推荐工作，从零构建了小米垂域业务的深度推荐引擎。主要研究方向是推荐系统、计算广告、搜索等，发表过多篇论文和专利。

易可欣
毕业于北京大学，先后在爱奇艺、快手担任推荐算法工程师，主要研究方向为召回策略与模型、数据挖掘、样本优化等。"

第1章  初识推荐系统 1
1.1  推荐系统大时代 1
1.1.1 推荐系统的定义 2
1.1.2 推荐系统的价值 3
1.1.3 推荐系统的天时地利 4
1.1.4 推荐系统架构概览 5
1.2 推荐系统的核心模块 7
1.2.1 内容理解：理解和刻画推荐内容 7
1.2.2 用户画像：理解和刻画用户 7
1.2.3 召回：为用户初筛内容 8
1.2.4 排序：为用户精选内容 9
1.2.5 重排：从业务角度进行内容调整 10
1.2.6 推荐系统质量评估体系 11
总结 11
第2章  多模态时代的内容理解 13
2.1 内容标签体系建设 14
2.1.1 标签体系的作用 14
2.1.2 标签体系设计和建设 14
2.1.3 标签提取和生成 16
2.2 文本内容理解 18
2.2.1 文本分类 18
2.2.2 文本标签提取 21
2.2.3 文本聚类 22
2.2.4 文本Embedding 22
2.2.5 知识图谱 26
2.3 多模态内容理解 28
2.3.1 图像分类 28
2.3.2 视频分类 30
2.3.3 视频多模态内容Embedding 31
2.4 内容理解在推荐系统中的应用 32
总结 33
第3章  比你更了解自己的用户画像 34
3.1 初识用户画像 34
3.1.1 什么是用户画像 35
3.1.2 用户画像的作用 35
3.1.3 用户画像系统架构 36
3.2 用户画像标签体系 37
3.2.1 用户基础属性标签 37
3.2.2 用户社交属性标签 39
3.2.3 用户行为属性标签 39
3.2.4 用户兴趣标签 40
3.2.5 用户分层标签 41
3.2.6 其他常用维度标签 41
3.3 用户画像标签开发 42
3.3.1 标签的基础数据 42
3.3.2 标签计算整体流程 42
3.3.3 规则类标签 44
3.3.4 统计类标签 44
3.3.5 模型类标签 45
3.4 用户画像实践案例 46
总结 51

第4章  包罗万象的召回环节 52
4.1 召回的基本逻辑和方法论 52
4.1.1 召回的重要性 52
4.1.2 召回与排序的区别 53
4.1.3 主要的召回策略与算法 54
4.2 传统召回策略 55
4.2.1 基于内容的召回 55
4.2.2 经典协同过滤召回 56
4.2.3 探索类召回 58
4.3 向量化模型召回 59
4.3.1 向量化模型召回原理 59
4.3.2 从KNN到ANN 60
4.3.3 经典向量化召回模型 62
4.4 基于用户行为序列的召回 65
4.4.1 SASRec――经典行为序列召回模型 65
4.4.2 BERT4Rec与BST――NLP技术与用户行为序列结合 66
4.4.3 MIND及其衍生――多兴趣召回模型 68
4.4.4 超长序列召回――建模用户全期兴趣 70
4.5 图Embedding在召回中的应用 72
4.5.1 图Embedding技术 73
4.5.2 DeepWalk――经典图Embedding方法 74
4.5.3 Node2Vec――DeepWalk更进一步 75
4.5.4 PinSAGE――GCN在推荐系统领域的工业化应用 76
4.5.5 MetaPath2Vec――异构图Embedding方法 77
4.6 前瞻性召回策略与模型 79
4.6.1 TDM――模型与索引结合的艺术 79
4.6.2 对比学习――样本的魔法 81
4.7 召回质量评估方法 82
4.7.1 召回评估方法概述 83
4.7.2 召回率、准确率、F1值――基准评估指标 83
4.7.3 HR、ARHR――TopN推荐评价指标 84
4.7.4 CG、DCG、nDCG――信息增益维度的评估指标 84
4.7.5 长尾覆盖评估 85
总结 86
第5章  投你所好的排序环节 87
5.1 排序环节的意义和优化方向 87
5.1.1 排序环节的意义 87
5.1.2 排序环节的优化方向 88
5.2 从Embedding看排序模型的演进 89
5.2.1 什么是Embedding 90
5.2.2 Embedding的产生过程 91
5.2.3 特征组合在深度排序模型中的应用 94
5.2.4 用户历史行为建模在深度排序模型中的应用 101
5.2.5 超大规模Embedding在实际中的应用 107
5.3 推荐系统粗排阶段及其发展历程 113
5.3.1 粗排定位与技术路线选择 114
5.3.2 粗排模型架构的演变 116
5.3.3 使用知识蒸馏增强粗排与精排的一致性 120
5.3.4 缓解样本选择偏差 128
5.3.5 粗排效果的评价 130
5.4 多目标排序建模 131
5.4.1 多目标排序建模的意义和挑战 131
5.4.2 多目标排序建模方法概览 132
5.4.3 多目标融合寻参 142
5.5 推荐系统排序阶段的评估 142
5.5.1 排序评估的两个阶段 143
5.5.2 常用的效果评估指标 144
5.5.3 常用的系统评估指标 145
5.5.4 离线和线上效果的一致性问题 146
总结 147
第6章  权衡再三重排序 148
6.1 重排序的必要性和作用 148
6.2 重排模型 150
6.2.1 重排模型建模的出发点 150
6.2.2 序列重排模型 151
6.2.3 基于强化学习的重排模型 157
6.3 重排多样性策略 160
6.3.1 重排多样性的出发点 160
6.3.2 多样性评估指标 161
6.3.3 规则多样性打散 162
6.3.4 多样性模型策略 164
6.4 重排中的业务规则 167
总结 169
第7章  如若初见冷启动 170
7.1 推荐冷启动的定义与挑战 170
7.2 冷启动一般解决思路 171
7.3 新用户推荐冷启动 173
7.3.1 新用户召回策略 173
7.3.2 新用户排序模型 175
7.3.3 新用户重排策略 177
7.4 新物品分发冷启动 178
7.4.1 新物品冷启动召回策略 179
7.4.2 新物品冷启动排序策略 180
7.4.3 新物品冷启动流量分配机制 181
总结 184
第8章  推荐系统中的魔术手 185
8.1 特征工程 185
8.1.1 特征的理解和分类 186
8.1.2 特征挖掘维度 186
8.1.3 工程视角下的特征工程开发 187
8.1.4 特征工程的流程和方法 190
8.2 样本加工艺术 193
8.2.1 如何提取有效样本 193
8.2.2 负样本优化 195
8.2.3 样本迁移 197
8.2.4 其他样本优化技巧 198
8.3 推荐系统实效性 198
8.3.1 推荐数据实效性 199
8.3.2 推荐模型实效性 201
8.3.3 在线学习整体机制 202
8.4 推荐中的偏差与消偏策略 202
8.4.1 推荐偏差的缘由 203
8.4.2 推荐系统常见偏差 203
8.4.3 常用的消偏技术和策略 205
总结 209
第9章  系统进化的利器――AB实验平台 210
9.1 什么是AB实验 210
9.2 AB实验平台框架 212
9.3 AB实验分流机制＆实验类型 214
9.4 AB实验效果评估 217
9.4.1 推荐系统常见的AB指标 218
9.4.2 AB实验的假设检验 219
9.4.3 AB实验的流量大小 221
9.5 AB实验并不是万能的 221
总结 225
第10章  推荐系统中的前沿技术 226
10.1 强化学习 226
10.2 因果推断 230
10.3 端上智能 235
10.4 动态算力分配 238
10.5 增益模型 241
总结 246

"推荐系统具有广泛的应用背景，作者基于自身在该领域多年从事研发的经验，将推荐系统整体框架作为切入点，全面而系统地介绍了与推荐系统相关的多项技术，包括内容理解、用户画像、排序、重排等。此外，本书还通过实际问题给出多个应用案例，使读者可以更好地理解和应用推荐系统技术。无论是相关领域的从业人员，还是高校学生，都可以从本书获益匪浅。
清华大学教授？|？马少平

从衣食住行到娱乐消费，推荐系统已经深度融入我们的日常生活，成为AI技术落地应用的典型场景。推荐系统不仅要解决多模态内容理解的语义鸿沟和用户兴趣偏好的意图鸿沟，还需要克服亿级用户与推荐内容下的工程开发与部署难题。本书从工业界的视角系统地介绍了推荐系统的核心技术和工程实现方案，每章的内容循序渐进，深度贴合实际应用，将工业界推荐系统的基础框架、核心技术和前沿发展呈现在读者面前。互联网服务领域的从业人员和高等院校相关专业的本科生、研究生都将从本书中受益。
清华大学教授？|？孙立峰

近年来，推荐系统已经在各种在线平台中得到广泛应用，成为用户获取信息、平台满足用户需求的主要途径之一。本书系统地梳理了推荐系统领域的相关重要技术，从多个方面对推荐算法的相关概念、模型及算法进行了详细介绍，涵盖了近期新的前沿技术。特别是，作者长期在工业界从事推荐算法的相关应用研究，本书的内容融入了作者对推荐算法的思考、体会及实战经验，相信相关技术人员能从本书中受益。
中国人民大学教授？|？赵鑫

在如今信息爆炸和碎片化的时代，推荐系统是解决信息过载和提升信息获取效率的重要技术。本书非常全面地梳理了推荐系统构建所要面临的核心问题，囊括了学术界和工业界主要的技术进展和实际应用经验。本书针对视频场景的推荐系统有精彩的介绍，对于文本、语音、图片和视频等多模态信息如何理解，以及应用到推荐系统，有详细的剖析和深入浅出的阐述。相信无论是入门的新手，还是资深的行业从业者，在本书中都能有所收益，从而对推荐系统有更好的理解。
快手NLP和音频中心负责人？|？张富峥

在信息爆炸的时代，推荐系统极大地提升了人与信息的匹配效率，是人工智能技术最典型、最成熟的应用之一，已然成为所有互联网产品的标配。本书作者团队来自互联网大厂，完整地经历了从推荐系统搭建、演化到成熟的全过程，并得以有机会将其总结、提炼并形成此书。此书不仅具有全局视野，体系完善，而且生动翔实，细节拉满。不管你是小白还是推荐系统的从业者，阅读此书都会让你受益匪浅。
数据智能社区DataFun创办人？|？王大川"

商品参数

基本信息
出版社	电子工业出版社
ISBN	9787121454226
条码	9787121454226
编者	胡澜涛等
译者	--
出版年月	2023-05-01 00:00:00.0
开本	其他
装帧	平装
页数	264
字数	396000
版次	1
印次	1
纸张

商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]