热门搜索: 中考 高考 考试 开卷17
服务电话 024-96192/23945006
 

R & Python数据科学与机器学习实践

编号:
wx1202687676
销售价:
¥76.33
(市场价: ¥89.80)
赠送积分:
76
商品介绍

《R & Python数据科学与机器学习实践》以动手实践的形式分绍了数据分析、统计分析和机器学习的相关内容,可以让读者在短时间内掌握使用R语言和Python从数据创建模型并获取结果的基本步骤,并用R & Python体验学习各种分析的“理论”和“实际思维方式”。全书共5章,其中第1章介绍了数据科学入门的基础知识,让读者对数据科学领域有一个整体认识;第2章介绍了R & Python的语法基础和编程入门相关知识,为编程基础薄弱的读者顺利学习本书打好坚实的编程基础;第3~4章介绍了非常重要的数据处理、数据分析和用R语言实现的统计建模方法;第5章介绍了用Python实现的以预测为目的的机器学习方法。对实践中经常遇到的数据质量问题和处理要点、回归模型、决策树、聚类、降推,以及常用的监督学习方法和深度学习等内容均进行了讲解。
《R & Python数据科学与机器学习实践》不是一本入门书,它是一本尽可能不使用数学公式面专注于利用的书,致力于让读者掌握使用R/Python实践数据科学与机器学习的基本技能并获得自身持续发展和深入学习所需的素养,特别适合有一定统计学和机器学习基础,想快速提升技能的程序员学习,也适合作为高校统计学、数据科学和人工智能相关专业的参考书。

有贺友纪,人类科学硕士。在野村综合研究所从事与企业IT应用趋势相关的调查和研究工作。根据从大学专业(心理学)中掌握的定量分析的经验出发,重点关注如何合理地利用数据和解决问题。另外,他还负责公司内部有关数据科学的培训计划制定、内容制作和教学工作。

第1章 数据科学入门
1.1 数据科学的基础
1.1.1 数据科学的重要性
1.1.2 数据科学的定义及历史
1.1.3 数据科学中的建模
1.1.4 数据科学及其相关领域
1.2 数据科学的实施
1.2.1 数据科学的流程及任务
1.2.2 数据科学实施所需的工具
1.2.3 数据科学实施所需的技能
1.2.4 数据科学的局限性及挑战
第2章 R语言与Python语言
2.1 R语言与Python语言的比较
2.2 R语言入门
2.2.1 R语言的概述
2.2.2 R语言的语法
2.2.3 数据结构与控制结构
2.3 Python语言入门
2.3.1 Python语言概述
2.3.2 Python语言的语法
2.3.3 Python语言的程序设计
2.3.4 NumPy与Pandas
2.4 比较R语言与Python语言的运行实例
第3章 数据分析与典型的模型
3.1 捕捉数据特征
3.1.1 捕捉分布的形态——视觉上的确认
3.1.2 计算描述性统计量——代表值与离散程度
3.1.3 把握关联性——相关系数的使用方法和含义
3.1.4 使用R语言的相关分析——利用日本地方政府调查数据的案例
3.1.5 各种统计分析——理论与实际思考方式
3.2 根据数据建立模型
3.2.1 目标变量和解释变量——解释和预测的“方向”
3.2.2 简单线性回归模型——R语言程序的运行与结果
3.2.3 使用虚拟变量建模——分析组间差异
3.2.4 复杂线性回归模型——交互作用及模型之间的比较
3.2.5 线性回归的原理与最小二乘法
3.3 评估模型
3.3.1 用于评估模型的观点
3.3.2 这个结果难道不是偶然的吗?——假设概率和显著性差异检验
3.3.3 模型是否与数据拟合——拟合系数与决定系数
3.3.4 模型是否过于复杂——过拟合和预测精度
3.3.5 残差分布——线性回归模型和诊断图
3.3.6 解释变量之间的相关性——多重共线性
3.3.7 标准偏回归系数
第4章 实践性的模型
4.1 建模的准备
4.1.1 数据的准备与处理加工
4.1.2 分析和建模的方法
4.2 数据的加工处理
4.2.1 数据的清洗
4.2.2 分类变量的加工
4.2.3 数值变量的处理加工与数据缩放
4.2.4 改变分布形态—-对数变换与Logit变换
4.2.5 缺失值的处理
4.2.6 离群值的处理
4.3 建模的方法
4.3.1 分组——聚类
4.3.2 指标聚合——因子分析和主成分分析
4.3.3 广义线性模型与逐步回归方法
4.3.4 以二值数据为目标变量的分析——逻辑回归方法
4.3.5 分段抽样及其特征的分析——决策树
4.4 因果推论
4.4.1 由数据明确因果关系——统计性因果推论
4.4.2 基于因果关系的变量选择
第5章 机器学习与深度学习
5.1 机器学习的目的与步骤
5.1.1 机器学习的基础
5.1.2 机器学习的步骤
5.1.3 关于数据准备的问题
5.1.4 抽出特征与特征向量
5.2 机器学习的运行
5.2.1 机器学习程序库的应用——scikit-learn
5.2.2 机器学习算法的示例——随机森林
5.2.3 机器学习算法的示例——支持向量机
5.2.4 机器学习的运行示例
5.3 深度学习
5.3.1 神经网络
5.3.2 支撑深度学习的技术
5.3.3 深度学习及框架
5.3.4 深度学习的运行
5.3.5 生成模型
参考文献

商品参数
基本信息
出版社 中国水利水电出版社
ISBN 9787522604473
条码 9787522604473
编者 (日)有贺友纪//大桥俊介
译者 朱迎庆
出版年月 2022-08-01 00:00:00.0
开本 16开
装帧 平装
页数 372
字数 522000
版次 1
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]