热门搜索: 中考 高考 考试 开卷17
服务电话 024-96192/23945006
 

增强型分析:AI驱动的数据分析.业务决策与案例实践

编号:
wx1201940841
销售价:
¥78.32
(市场价: ¥89.00)
赠送积分:
78
商品介绍

(1)本书极具前瞻性:增强型分析是数据分析和数据科学的未来,人工智能技术为数据分析与决策赋能是未来必然发展趋势;(2)本书极具优选性:详细讲解了序列分析、预测分析、规范性分析、RNN、CNN、GAN等前沿的数据处理技术和人工智能技术;(3)本书极具性:本书3位作者是来自德勤、华为和前IBM的数据科学家,都在数据科学和人工智能领域有超过10年以上的工作经验;(4)本书极具实战性:本书不只是讲技术和工具,重点还有技术如何与实际的业务相结合,包含大量的实战案例。

内容简介增强型分析是数据科学的未来,本书讲解了如何通过前沿的大数据技术和AI技术实现智能的数据分析和业务决策,即增强型分析。本书的三位作者是来自德勤、前华为和前IBM的数据科学家,在大数据和AI领域至少都有10年以上的工作经验,他们将各自多年来在“构建数据挖掘模型,解决实际业务问题”方面积累的经验全部总结在了这本书中。全书的内容由两条主线贯穿:技术主线:一方面讲解了预测模型、序列分析、预测分析、Prescriptive分析等前沿数据处理技术,一方面讲解了CNN、RNN和GNN等前沿的AI技术如何为数据分析赋能。业务主线:在数字化转型的大时代背景下,如何通过数据分析实现智慧营销、智慧风险管控,实现由初级的“主动营销”到“被动营销”,再到“全渠道协同营销”等营销手段的升级应用。本书的重点聚焦在本质内容上,即数据处理、算法及模型、“模型洞见到业务决策”的分析等。全书共8章:章:作者结合自己的从业经验介绍了数据科学家的职业生涯发展、工作模式和工作方法要点等内容,为有志成为数据科学家的读者指明了道路和方向;第2章:从描述性分析的角度讲解了数据探索、数据预处理衍生指标加工方面的技巧;第3章:介绍了预测类模型构建时的新方法、新思路、新工具;第4章:讲解了序列分析的相关内容,包括序列模式、序列规则、序列预测等的挖掘与应用,用实例的方式说明了算法的原理、特点和使用技巧;第5章:介绍了人工智能下一个阶段的重点领域,即如何应用数据分析做出*优决策;第6~8章:通过与传统模型的对比,介绍了CNN、RNN、GNN等算法的原理,通过大量的实例说明了这些AI技术在数据分析与决策领域的用法和实际效果。

作者简介彭鸿涛 德勤企业咨询总监兼首席数据科学家,德勤优选AI团队核心成员,德勤数字化转型、智慧营销、智慧风控、客户体验等核心咨询服务方案的顾问。2008年加入SPSS并与跨国家团队一起进行Analytical Decision Management决策自动化工具的开发,与靠前外团队一起构建了SPSS在不同应用领域的解决方案,其中某些方案现已成长为IBM的知名解决方案;2014年加入IBM GBSC部门,领导数据分析团队,针对不同客户设计和实施数据分析的方案;2016年加入IBM GBS GBS Cognitive Business Decision Support担任CTO和首席数据科学家,领导团队开发实施了有一定行业影响力的人工智能应用;2017年加入德勤企业咨询担任金融服务总监及首席数据科学家,领导团队开拓数字化转型背景下的新型咨询服务方案,期间高质量交付大型银行的数字化转型及实施相关项目并得到客户高度认可。张宗耀 上海全应科技有限公司数据科学家,前华为企业智能部门数据科学家,前IBM SPSS 算法组件团队算法工程师。 2009年加入IBM SPSS算法组件团队,负责Statistic和Modeler产品的升级和维护;2012年开始大数据算法组件的设计和开发,为分布式分析引擎提供了核心计算单元,完成开发了分布式平台下的广义线性模型、自动建模算法、ADMM优化算法等,打造了分析引擎平台以及SPSS Modeler产品的*具竞争力算法模块;2015年开始投入Spark分布式框架的算法设计和开发,完成开发了生存分析算法、时间序列相关算法等,丰富了SPSS产品的核心算法组件。2016年加入华为,先后就职于华为的数据挖掘团队,以及企业智能部门的机器学习服务团队和工业解决方案团队,负责算法、机器学习、实时预测、数据分析,以及行业解决方案的设计、开发和部署相关的工作。聂磊陕西万禾数字科技有限公司CTO,前IBM SPSS 数据科学家,前IBM Watson Analytics数据分析引擎技术主管及架构师。2008 年加入IBM Analytical Decision Management团队,开发了业务规则引擎和基于优化技术的预测性维护解决方案;2014年加入IBM Watson Analytics团队,担任技术主管兼架构师,了IBM Watson Analytics数据分析引擎基于Spark技术的转换,极大提高了平台的计算能力;2017年担任IBM Cognos Analytics团队架构师,主持了自动化技术的引入。

推荐序一推荐序二前言章  数据科学家的成长之路11.1 算法与数据科学家11.1.1 数据科学、人工智能、机器学习等21.1.2 室内活动还是室外活动31.2 数据科学家不断成长的几个阶段31.2.1 算法——如何构建数据分析模型51.2.2 用法——如何回头看模型61.2.3 业务——如何产生更大价值71.2.4 战略——如何更广81.3 数据科学家的工作模式与组织结构91.3.1 数据驱动还是业务驱动91.3.2 数据科学家团队的组织结构91.4 数据科学家的工作方法要点10第2章  大数据探索及预处理132.1 大数据探索132.1.1 数值类型132.1.2 连续型数据的探索142.1.3 分类型数据的探索192.1.4 示例:数据探索202.2 数据预处理262.2.1 数据清洗262.2.2 数据变换292.2.3 数据归约412.3 衍生指标的加工442.3.1 衍生指标概述452.3.2 将数值转化为百分位数452.3.3 把类别变量替换为数值462.3.4 多变量组合472.3.5 从时间序列中提取特征47第3章  预测模型的新技术493.1 集成学习493.1.1 Averaging方法493.1.2 Boosting方法513.2 Gradient Tree Boosting介绍533.2.1 梯度与梯度下降533.2.2 Gradient Tree Boosting算法的原理553.3 Gradient Tree Boosting的改进方向573.3.1 Gradient Tree Boosting的使用要点573.3.2 Regularization593.3.3 XGBoost介绍603.4 模型的最佳参数设置603.5 投票决定最终预测结果653.6 让模型在训练结束后还能被更新663.6.1 热启动673.6.2 增量学习673.7 多输出预测683.7.1 Binary Relevance693.7.2 Classifier Chain703.7.3 Ensemble Classifier Chain703.8 案例:如何给客户从数百个产品中寻找合适的产品713.8.1 问题提出723.8.2 建模思路723.8.3 模型训练及应用73第4章  序列分析764.1 通过客户行为研究做出服务策略764.2 频繁项集、关联规则的挖掘774.2.1 基本概念774.2.2 频繁或稀疏项集的挖掘784.2.3 关联规则的挖掘864.3 序列模式的挖掘以及应用884.3.1 换种视角观察项间的顺序884.3.2 “事无巨细”还是“事有巨细”894.3.3 序列挖掘的相关算法介绍924.3.4 示例:挖掘购买物品的序列模式964.4 序列规则的挖掘以及应用1014.4.1 将频繁序列通过业务解读转换为行动指南1014.4.2 序列规则的挖掘实现行动指南1024.4.3 序列规则的挖掘算法1024.4.4 示例:通过客户购买产品的序列推荐合适的产品1044.5 序列预测的挖掘以及应用1074.5.1 序列规则与序列预测的关系1074.5.2 序列预测算法的介绍1084.5.3 示例:客户下一步会做什么110第5章  应用数据分析做出最优决策1145.1 Prescriptive分析概述1145.1.1 业务分析的3个层次1155.1.2 为什么需要Prescriptive分析1165.1.3 什么时候需要Prescriptive分析1175.2 确定因素和非确定因素下的决策分析1185.3 What-If分析和Goal Seeking分析1215.4 优化技术介绍1225.4.1 数据挖掘算法中常用的优化技术1225.4.2 优化问题求解工具介绍1275.4.3 CVXPY优化工具在机器学习算法中的应用1305.4.4 应用优化技术寻找最优产品推荐1345.5 仿真分析1355.5.1 蒙特卡洛的介绍1355.5.2 采用蒙特卡洛方法进行重采样1375.6 马尔可夫链及马尔可夫决策过程1435.6.1 马尔可夫过程及马尔可夫链1455.6.2 马尔可夫决策过程及应用工具1485.6.3 应用马尔可夫决策过程研究营销策略及客户生命周期价值151第6章  深入探讨CNN1556.1 换个角度讨论CNN1556.1.1 卷积是在做什么1566.1.2 人脸检测与人脸识别1596.1.3 深度学习意味着什么1656.1.4 CNN的结构1686.1.5 CNN的训练及结果1726.2 用CNN做人脸识别1746.2.1 数据加载1756.2.2 使用ImageDataGenerator1756.2.3 定义模型和训练模型1766.2.4 详细探究卷积最终的效果1786.3 Embedding1816.3.1 文本向量化的一般方法1816.3.2 Word Embedding的原理及实现1866.3.3 利用Word Embedding实现翻译1906.3.4 Embedding的用途不止于Word Embedding1926.4 一个例子:文本分类1936.4.1 采用传统分类模型实现文本分类1936.4.2 采用CNN进行文本分类1966.4.3 采用FastText进行文本分类200第7章  深入探讨RNN2017.1 两种建模方法:Prediction 和 Sequence Labeling2017.1.1 Prediction的特点2017.1.2 Sequence Labeling的特点2027.2 RNN及其变种的详细原理2037.2.1 RNN的Activation 函数2047.2.2 RNN 的初级神经元及计算逻辑2057.2.3 LSTM的神经元及计算逻辑2057.2.4 GRU的神经元与计算逻辑2067.2.5 深度RNN的原理2077.2.6 RNN算法的输入输出形式2087.3 利用LSTM预测股票价格2097.3.1 模型构建及验证2097.3.2 模型应用的探讨2167.4 让计算机学会写唐诗2167.4.1 构想:如何让计算机能够写出唐诗2167.4.2 构建:模型实现的过程2187.5 预测客户的下一个行为2217.

人工智能技术由于数据、算法、硬件支撑的计算能力等核心要素的共同发展,进入了广泛的、实质性的应用阶段。在不远的将来,我们肯定能看到人工智能及其相关技术在不同行业发挥巨大的价值。增强型分析将会长足发展多年以来,人们在构建模型时总是要花费大量的时间和精力在准备数据、数据预处理、多次尝试构建模型、模型验证等过程上。在工业发展的历程中,纯手工打造的时代势必要被标准化流水线的工厂取代,因为工序分解后可以按照统一的模式来处理。构造模型的过程也可以从纯手工打造时代发展为一个更加智能化的时代。笔者十年前在SPSS任职时,就深度参与了自动化建模相关组件的开发,即同一个模型可以按照不同的算法来实现并通过同一个评价指标筛选出最优模型。这样的功能在现在的开源算法库(如sklearn)中已经非常常见。最近AutoML、H2O等知名开源平台使得自动化建模又有了长足的发展。然而建模自动化并不是终点。增强型分析(Augmented Analytics)于Gartner在2017年7月发表的《增强型分析是数据及分析的未来》报告中首次进入人们的视野。其核心的概念包括:智慧数据洞察(Smart Data Discovery)。应用相关的工具能够比较智能和自动化地实现数据收集、准备、集成、分析、建模,能够输出各种洞察,可以为人们在战略方向、对应具体范围的战术活动(如针对某市场机会发起营销)、执行(具体执行营销策略)等不同层面的活动提供指导,包括相关关系的发现、模式识别、趋势判断与预测、决策建议等。增强型数据准备(Augmented Data Preparation)。提供智能化的工具使得业务人员能够快速、轻松地访问数据,并连接各种数据源通过统一的、标准化的、可交互的视图展现内容、数据间的关系等。同时提供丰富的工具进行自动数据归约、清洗、智能化分箱、降噪等功能。增强型数据要能够在原数据和经过数据治理后的数据间灵活处理,尽量避免因为数据治理而丢失信息,同时也避免在大量原数据间进行无序的探索。从上述的定义中可以看出,增强型分析的特点是其可以智能和自动地完成数据准备和数据分析的工作。对于增强型分析的一个美好的预期就是“交给机器大量的原数据,机器直接针对特定场景给出决策建议”。要实现这个愿景需要人们至少完成如下的几个要点。(1)大数据存储与访问基于大数据平台的存储、计算的相关技术发展很快,目前已经比较成熟,能够高效地处理大量数据。(2)数据分析流程的组件化、标准化改造数据分析过程中关键步骤如数据收集、准备、集成、分析、建模等过程,需要细分为不同的子任务,并通过子任务间的灵活搭配构成数据分析的流程。流程的自动化运行以及对应的有价值的结果输出已经有了较好的组件,如H2O等。(3)提供大量的算法支持数据处理、模型构建算法既可以用来构建业务模型,也可以用来分析数据间的关系、进行变量聚类等工作。(4)将“模型洞见到业务决策”纳入分析范围模型输出洞见,如模型输出每一个客户的购买可能性,还需要配套如“当购买可能性大于90%时再根据时机因素进行推荐”的业务决策,才能在实际营销活动中实施。这是一个“洞见—决策—行动”的过程。实现增强型分析所需的技术势必是庞杂的,本书的重点涵盖范围是数据处理、算法及模型、“模型洞见到业务决策”的分析等内容。这些内容既是我们日常建模时要用到的技术,也是增强型分析中必不可少的内容。虽然增强型分析的表现形式是追求智能化、自动化等功能,但是增强型分析的终极目标还是通过数据分析发挥数据价值。目前增强型分析还处于概念在逐步清晰但需要不断发展的阶段,所以本书的重点是聚焦在其本质内容,即数据处理、算法及模型、“模型洞见到业务决策”的分析等内容。本书特点应用机器学习、人工智能技术不仅需要理解算法原理,还需要对算法参数调优、算法使用时的数据要求、算法输出结果,以及如何在具体业务场景使用数据挖掘模型等方面都有所了解,这样才能真正发挥数据价值,产生实际的业务效果。本书作者结合多年来给不同的大型机构“构建数据挖掘模型、解决实际业务问题”的实践,总结归纳技术、应用等方面的经验,以“介绍较新机器学习及人工智能技术”和“如何应用这些技术解决实际问题”两个方面作为本书的整体选题思路。总体来讲,本书具有如下两个主要特点。(1)介绍较新的技术有监督学习的建模技术早已不是只懂得算法就可以了。目前基于集成学习、Grid Search、交叉验证等自动化建模技术方兴未艾,这些技术在专门的章节作了重点介绍;基于序列模式挖掘、序列规则、序列预测等进入公众视野还较新的技术在实际业务中有巨大的价值,这些也是本书介绍的重点;对于目前比较火热的深度学习、对抗学习等内容,本书也有专门的章节进行介绍。从这些技术的特点来看,已经具备了增强型分析的部分特点,如集成学习的技术就是旨在将多个模型结合起来,达到相对于单独采用一个模型而明显改善的效果。(2)兼顾原理与大量实例按照深入浅出的方式介绍算法原理、参数调优及使用方法等信息,并结合实际例子展示如何使用以及使用时的思路。笔者采用“深入浅出的原理介绍

商品参数
基本信息
出版社 机械工业出版社
ISBN 9787111634164
条码 9787111634164
编者 彭鸿涛 张宗耀 聂磊
译者 --
出版年月 2018-03-01 00:00:00.0
开本 16开
装帧 平装
页数 258
字数 null千字
版次 1
印次 1
纸张 一般胶版纸
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]