热门搜索: 中考 高考 考试 开卷17
服务电话 024-96192/23945006
 

R语言数据分析项目开发实战

编号:
wx1201944666
销售价:
¥95.92
(市场价: ¥109.00)
赠送积分:
96
商品介绍

本书详细阐述了与数据分析相关的基本解决方案,主要包括关联规则挖掘、基于内容的模糊逻辑推荐系统、协同过滤机制、基于深度神经网络的时序数据、Twitter文本情感分类、记录链接—随机和机器学习方案、流式数据聚类分析、分析并理解网络等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
本书既可作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。

目 录
章 关联规则挖掘 1
1.1 理解推荐系统 2
1.1.1 事务 2
1.1.2 加权事务 3
1.1.3 Web应用程序 3
1.2 零售商用例和数据 4
1.3 关联规则挖掘 6
1.4 关联销售营销活动 22
1.4.1 杠杆效应 25
1.4.2 确信度 26
1.5 加权关联规则挖掘 27
1.6 基于超链接的主题搜索(HITS) 34
1.7 负关联规则 41
1.8 规则的可视化 45
1.9 封装 49
1.10 本章小结 56
第2章 基于内容的模糊逻辑推荐系统 57
2.1 基于内容的推荐系统 58
2.2 新闻聚合器用例和数据 62
2.3 设计基于内容的推荐引擎 67
2.3.1 构建相似度索引 69
2.3.2 搜索机制 75
2.4 完整的R代码 94
2.5 本章小结 101
第3章 协同过滤机制 102
3.1 协同过滤 102
3.1.1 基于内存的方案 104
3.1.2 基于模型的方案 104
3.1.3 隐因子模型方案 106
3.2 recommenderlab数据包 107
3.3 用例和数据 111
3.4 设计并实现协同过滤机制 120
3.4.1 评级矩阵 120
3.4.2 标准化 121
3.4.3 随机划分训练集和测试集 123
3.4.4 训练模型 125
3.5 完整的R代码 136
3.6 本章小结 142
第4章 基于深度神经网络的时序数据 143
4.1 时序数据 144
4.1.1 非季节性时序 145
4.1.2 季节性时序 146
4.1.3 回归问题 147
4.2 深度神经网络 150
4.2.1 前向循环 152
4.2.2 反向循环 153
4.3 MXNet数据包 153
4.4 MXNet中的符号编程 155
4.4.1 softmax激活函数 159
4.4.2 用例和数据 162
4.4.3 基于时序预测的深度网络 163
4.5 训练-测试集划分 165
4.6 完整的R代码 177
4.7 本章小结 185
第5章 Twitter文本情感分类 186
5.1 核密度估计 187
5.2 Twitter文本 191
5.3 情感分类 192
5.3.1 字典方法 192
5.3.2 机器学习方法 193
5.3.3 当前方案 193
5.4 基于字典的评级机制 194
5.5 文本预处理 197
5.5.1 词频逆文档频率(TFIDF)方案 199
5.5.2 Delta TDIDF 200
5.6 构建情感分析分类器 202
5.7 整合RShiny应用程序 206
5.8 完整的R代码 210
5.9 本章小结 215
第6章 记录链接―随机和机器学习方案 216
6.1 用例 216
6.2 使用RecordLinkage 217
6.2.1 特征生成 218
6.2.2 字符串比较 221
6.2.3 语音特征 222
6.3 随机记录链接 223
6.3.1 期望优选化方法 223
6.3.2 基于权重的方法 229
6.4 基于机器学习的记录链接 232
6.4.1 无监督学习 233
6.4.2 监督学习 234
6.5 构建RShiny应用程序 239
6.6 完整的R代码 242
6.6.1 特征生成 242
6.6.2 期望优选化方法 244
6.6.3 基于权重的方法 245
6.6.4 机器学习方法 246
6.6.5 RShiny应用程序 247
6.7 本章小结 249
第7章 流式数据聚类分析 250
7.1 流式数据及其面临的挑战 250
7.1.1 边界问题 251
7.1.2 漂移问题 251
7.1.3 单路处理 252
7.1.4 实行性 252
7.2 流式聚类 252
7.3 流数据包 253
7.3.1 数据流数据 253
7.3.2 作为静态模拟器的DSD 254
7.3.3 连接至内存、文件或数据库的DSD 259
7.3.4 in-flight操作 261
7.3.5 将DSD连接至真实的数据流 261
7.3.6 数据流任务 261
7.4 用例和数据 266
7.4.1 速度层 267
7.4.2 批处理层 267
7.4.3 蓄水池采样 270
7.5 完整的R代码 272
7.6 本章小结 274
第8章 分析并理解网络 276
8.1 R语言中的图 277
8.1.1 顶点的度 280
8.1.2 顶点强度 280
8.1.3 邻接矩阵 280
8.1.4 R中的更多网络 281
8.1.5 顶点的中心度 282
8.1.6 节点的远度和近度 282
8.1.7 计算节点间的最短路径 283
8.1.8 图的随机遍历 283
8.2 用例和数据 283
8.3 数据准备 285
8.4 商品网络分析 289
8.5 编写RShiny应用程序 296
8.6 完整的R代码 302
8.7 本章小结 307

商品参数
基本信息
出版社 清华大学出版社
ISBN 9787302533641
条码 9787302533641
编者 [印]戈皮·萨博拉曼尼 著 杨崇珉 译
译者
出版年月 2018-03-01 00:00:00.0
开本 16开
装帧 平装
页数 307
字数
版次 1
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]