暂无商品咨询信息 [发表商品咨询]
本书通俗易懂,在引入数学模型和算法之前,先以非技术性语言阐释每种方法背后的核心理念。内容聚焦且深入,为学生提供核心概念的详细介绍,奠定自主探索该领域的坚实基础。无论是前面的章节还是后面的案例研究,都生动展示了预测模型学习过程如何融入更广阔的商业实践。第五部分的两个案例研究详细描述了数据分析项目的全过程,涵盖从业务问题定义到分析解决方案实施的各个阶段。本书既可作为入门教材使用,也可作为专业人士的参考指南。
本书重点讲述用于预测性数据分析的重要的机器学习方法,包括理论概念和实际应用。
John D. Kelleher,现为爱尔兰都柏林理工大学(Technological University Dublin)信息、通信和娱乐研究所教授和学术领导人。专业领域包括机器学习、数据科学、自然语言处理和人工智能。曾在多个不同的学术和研究机构工作,包括都柏林城市大学(Dublin City University)、欧洲媒体实验室(Media Lab Europe)和德国人工智能研究中心(DFKI)。他在MIT出版社出版了三本机器学习和数据科学方面的著作,除了本书之外,另外两本是《深度学习》(Deep Learning)和《数据科学》(Data Science)。<br />
目 录<br />译者序<br />前言<br />符号<br />第一部分 机器学习和数据分析导论<br />第1章 面向预测数据分析的机器<br /> 学习2<br />1.1 什么是预测数据分析2<br />1.2 什么是机器学习3<br />1.3 机器学习是如何工作的6<br />1.4 归纳偏差与采样偏差9<br />1.5 机器学习可能出现什么问题10<br />1.6 预测数据分析项目的生命周期:<br /> CRISP-DM11<br />1.7 预测数据分析工具12<br />1.8 未来之路13<br />1.9 习题14<br />第2章 从数据到见解再到决策16<br />2.1 将业务问题转化为分析解决方案16<br />2.1.1 案例研究:汽车保险欺诈17<br />2.2 评估可行性18<br />2.2.1 案例研究:汽车保险欺诈19<br />2.3 设计分析基础表19<br />2.3.1 案例研究:汽车保险欺诈21<br />2.4 设计和实现特征22<br />2.4.1 不同类型的数据23<br />2.4.2 不同类型的特征24<br />2.4.3 处理时间25<br />2.4.4 法律问题28<br />2.4.5 实现特征28<br />2.4.6 案例研究:汽车保险欺诈29<br />2.5 总结31<br />2.6 延伸阅读32<br />2.7 习题33<br />第3章 数据探索36<br />3.1 数据质量报告37<br />3.1.1 案例研究:汽车保险欺诈37<br />3.2 了解数据40<br />3.2.1 正态分布42<br />3.2.2 案例研究:汽车保险欺诈43<br />3.3 辨识数据质量问题44<br />3.3.1 缺失值44<br />3.3.2 不规则基数45<br />3.3.3 异常值45<br />3.3.4 案例研究:汽车保险欺诈46<br />3.4 处理数据质量问题47<br />3.4.1 处理缺失值48<br />3.4.2 处理异常值48<br />3.4.3 案例研究:汽车保险欺诈49<br />3.5 高级数据探索50<br />3.5.1 可视化特征之间的关系50<br />3.5.2 度量协方差和相关性57<br />3.6 数据准备61<br />3.6.1 标准化61<br />3.6.2 分箱62<br />3.6.3 采样65<br />3.7 总结66<br />3.8 延伸阅读67<br />3.9 习题67<br />第二部分 预测数据分析<br />第4章 基于信息的学习82<br />4.1 主要思想82<br />4.2 基础知识84<br />4.2.1 决策树85<br />4.2.2 香农熵模型86<br />4.2.3 信息增益89<br />4.3 标准方法:ID3算法93<br />4.3.1 实用范例:植被分布预测95<br />4.4 扩展和变体100<br />4.4.1 其他特征选择和不纯净度<br /> 度量100<br />4.4.2 处理连续型描述性特征103<br />4.4.3 预测连续型目标106<br />4.4.4 树剪枝108<br />4.4.5 模型集成111<br />4.5 总结119<br />4.6 延伸阅读120<br />4.7 习题121<br />第5章 基于相似性的学习127<br />5.1 主要思想127<br />5.2 基础知识128<br />5.2.1 特征空间128<br />5.2.2 使用距离度量来衡量<br /> 相似性129<br />5.3 标准方法:最近邻算法131<br />5.3.1 实用范例131<br />5.4 扩展和变体134<br />5.4.1 处理噪声数据134<br />5.4.2 高效的内存搜索137<br />5.4.3 数据标准化143<br />5.4.4 预测连续型目标146<br />5.4.5 其他相似性度量149<br />5.4.6 特征选择156<br />5.5 总结161<br />5.6 延伸阅读163<br />5.7 后记164<br />5.8 习题164<br />第6章 基于概率的学习170<br />6.1 主要思想170<br />6.2 基础知识171<br />6.2.1 贝叶斯定理173<br />6.2.2 贝叶斯预测175<br />6.2.3 条件独立性和因子分解179<br />6.3 标准方法:朴素贝叶斯模型182<br />6.3.1 实用范例183<br />6.4 扩展和变体185<br />6.4.1 平滑处理186<br />6.4.2 连续型特征:概率密度<br /> 函数188<br />6.4.3 连续型特征:分箱196<br />6.4.4 贝叶斯网络199<br />6.5 总结210<br />6.6 延伸阅读212<br />6.7 习题212<br />第7章 基于误差的学习217<br />7.1 主要思想217<br />7.2 基础知识218<br />7.2.1 简单的线性回归218<br />7.2.2 测量误差220<br />7.2.3 误差曲面222<br />7.3 标准方法:使用梯度下降的<br /> 多变量线性回归223<br />7.3.1 多变量线性回归223<br />7.3.2 梯度下降224<br />7.3.3 选择学习率和初始权重229<br />7.3.4 实用范例230<br />7.4 扩展和变体232<br />7.4.1 解释多变量线性回归模型232<br />7.4.2 使用权重衰减设置学习率234<br />7.4.3 处理类别型描述性特征235<br />7.4.4 处理类别型目标特征:<br /> logistic回归236<br />7.4.5 建模非线性关系246<br />7.4.6 多项式logistic回归250<br />7.4.7 支持向量机253<br />7.5 总结257<br />7.6 延伸阅读259<br />7.7 习题259<br />第8章 深度学习267<br />8.1 主要思想268<br />8.2 基础知识269<br />8.2.1 人工神经元269<br />8.2.2 人工神经网络272<br />8.2.3 神经网络的矩阵运算273<br />8.2.4 为什么非线性激活函数<br /> 是必要的276<br />8.2.5 为什么网络深度很重要277<br />8.3 标准方法:反向传播和梯度<br /> 下降282<br />8.3.1 反向传播:算法的<br /> 一般结构283<br />8.3.2 反向传播:误差梯度的<br /> 反向传播284<br />8.3.3 反向传播:更新网络中<br /> 的权重288<br />8.3.4 反向传播:算法291<br />8.3.5 实用范例:使用反向<br /> 传播训练前馈网络完成<br /> 回归任务293<br />8.4 扩展和变体303<br />8.4.1 梯度消失和ReLU304<br />8.4.2 权重初始化和不稳定<br /> 梯度313<br />8.4.3 处理类别型目标特征:<br /> softmax输出层和交叉<br /> 熵损失函数321<br />8.4.4 早停法和随机失活:<br /> 防止过拟合328<br />8.4.5 卷积神经网络332<br />8.4.6 序列模型:循环神经网<br /> 络和长短时记忆网络347<br />8.5 总结361<br />8.6 延伸阅读362<br />8.7 习题363<br />第9章 评估368<br />9.1 主要思想368<br />9.2 基础知识 369<br />9.3 标准方法:留出测试集上的<br /> 误分类率369<br />9.4 扩展和变体373<br />9.4.1 设计评估实验373<br />9.4.2 性能度量:类别型目标<br /> 特征378<br />9.4.3 性能度量:预测分数384<br />9.4.4 性能度量:多目标特征396<br />9.4.5 性能度量:连续型目标<br /> 特征399<br />9.4.6 部署后评估模型402<br />9.5 总结407<br />9.6 延伸阅读407<br />9.7 习题408<br />第三部分 预测模型之外<br />第10章 预测模型之外:<br /> 无监督学习416<br />10.1 主要思想416<br />10.2 基础知识417<br />10.3 标准方法:k-means聚类算法418<br />10.3.1 实用范例419<br />10.4 扩展和变体422<br />10.4.1 选择初始簇质心422<br />10.4.2 评估聚类424<br />10.4.3 选择簇的数量428<br />10.4.4 理解聚类结果428<br />10.4.5 凝聚层次聚类430<br />10.4.6 使用自编码器进行表示<br /> 学习438<br />10.5 总结441<br />10.6 延伸阅读442<br />10.7 习题442<br />第11章 预测模型之外:强化学习448<br />11.1 主要思想448<br />11.2 基础知识449<br />11.2.1 智能代理449<br />11.2.2 强化学习的基础450<br />11.2.3 马尔可夫决策过程452<br />11.2.4 贝尔曼方程458<br />11.2.5 时序差分学习459<br />11.3 标准方法:Q学习,离线策略<br /> 时序差分学习462<br />11.3.1 实用范例463<br />11.4 扩展和变体467<br />11.4.1 SARSA在线策略时序<br /> 差分学习467<br />11.4.2 深度Q网络470<br />11.5 总结475<br />11.6 延伸阅读476<br />11.7 习题477<br />第四部分 案例研究和结论<br />第12章 案例研究:客户流失482<br />12.1 业务理解482<br />12.2 数据理解484<br />12.3 数据准备487<br />12.4 建模491<br />12.5 评估492<br />12.6 部署495<br />第13章 案例研究:星系分类496<br />13.1 业务理解496<br />13.1.1 情景流畅性498<br />13.2 数据理解499<br />13.3 数据准备504<br />13.4 建模507<br />13.4.1 基线模型508<br />13.4.2 特征选择510<br />13.4.3 五级别模型511<br />13.5 评估513<br />13.6 部署513<br />第14章 预测数据分析的机器<br /> 学习艺术515<br />14.1 预测模型的不同视角516<br />14.2 选择机器学习方法519<br />14.2.1 将机器学习方法与项目<br /> 匹配520<br />14.2.2 将机器学习方法与数据<br /> 匹配522<br />14.3 预测模型之外523<br />14.4 下一步学习资料推荐523<br />第五部分 附录<br />附录A 机器学习的描述性统<br /> 计量和数据可视化526<br />附录B 机器学习的概率入门536<br />附录C 机器学习的微分技术543<br />附录D 线性代数入门547<br />参考文献550
| 基本信息 | |
|---|---|
| 出版社 | 机械工业出版社 |
| ISBN | 9787111791638 |
| 条码 | 9787111791638 |
| 编者 | [爱]约翰·D. 凯莱赫(John D. Kelleher),[爱]布莱恩·马克·纳米(Brian Mac Namee),[爱]奥伊弗·达西(Aoife D'Arcy) 著 |
| 译者 | |
| 出版年月 | 2025-11-01 00:00:00.0 |
| 开本 | 16开 |
| 装帧 | 平装 |
| 页数 | 560 |
| 字数 | 900 |
| 版次 | 1 |
| 印次 | 1 |
| 纸张 | 一般胶版纸 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]