热门搜索: 中考 高考 考试 开卷17
服务电话 024-96192/23945006
 

机器学习

编号:
wx1201695689
销售价:
¥69.52
(市场价: ¥79.00)
赠送积分:
70
数量:
   
商品介绍

詹森?贝尔著的《机器学习(实用技术指南)/数据分析与决策技术丛书》专注于各种机器学习方法的使用及其工程实践,旨在帮助你掌握机器学习实践技能,不涉及过多的数学理论。书中以实例方式讲述通用的机器学习概念,你将学到机器学习的常用策略、机器学习的不同方法,以及如何在实时和批处理环境下应用它们。
全书共12章,靠前章和第2章介绍机器学习和数据挖掘的定义、实践中所使用的相关工具及其产生的效果;第3章到第8章聚焦于不用类型的机器学习理论,包括决策树、贝叶斯网络、神经网络模型、关联规则学习、支持向量机、聚类等,详细展示这些方法的使用,并提供代码示例;第9章和靠前0章是实例攻略,将对比实时和批处理两种环境下的方法,并且考察如何将它们整合在一个大的算法框架中;靠前1章和靠前2章将介绍Apache Spark和R语言。

詹森·贝尔(Jason Bell),从2002年以来一直研究销售点系统管理与客户忠诚度数据,并且从事软件行业已经超过25年。他是Datasentiment的创始人,该公司帮助企业在优选范围内进行数据采集、处理与洞察。

译者序
前言
致谢
第1章 什么是机器学习
1.1 机器学习的历史
1.1.1 阿兰·图灵
1.1.2 亚瑟·塞缪尔
1.1.3 汤姆 M.米切尔
1.1.4 总结定义
1.2 机器学习的算法类型
1.2.1 监督学习
1.2.2 无监督学习
1.3 人的作用
1.4 机器学习的用途
1.4.1 软件
1.4.2 股票交易
1.4.3 机器人学
1.4.4 医学和医疗
1.4.5 广告业
1.4.6 零售和电子商务
1.4.7 游戏分析
1.4.8 物联网
1.5 机器学习语言
1.5.1 Python
1.5.2 R
1.5.3 Matlab
1.5.4 Scala
1.5.5 Clojure
1.5.6 Ruby
1.6 本书使用的软件
1.6.1 检查Java版本
1.6.2 Weka 工具包
1.6.3 Mahout
1.6.4 Spring XD
1.6.5 Hadoop
1.6.6 使用集成开发环境
1.7 数据库
1.7.1 加州大学欧文分校机器学习库
1.7.2 Infochimps
1.7.3 Kaggle
1.8 总结
第2章 筹备机器学习
2.1 机器学习周期
……
第3章 决策树
第4章 贝叶斯网络
第5章 人工神经网络
第6章 关联规则学习
第7章 支持向量机
第8章 聚类
第9章 实时机器学习―使用Spring XD框架
第10章 批处理系统的机器学习
第11章 Apache Spark
第12章 基于R语言的机器学习
附录A Spring XD快速入门
附录B Hadoop 1.x快速入门
附录C 常用UNIX命令
附录D 进一步阅读

前    言  Preface数据,数据,数据!想必在新闻、报刊、白皮书、电视等媒介的持续冲击下,人们无法摆脱大数据和数据科学的洗礼。现实需求推动了对数据的学习、分析和应用,这些数据来自社交媒体、智能手机、硬件设备(也称作“物联网”)、传感器等任何可以产生数据的设备。    大多数数据挖掘的宣传着重于数据规模和处理速度。数据洪水(data flood)的预言告诉人们,我们无法实时处理这些数据,硬件推销人员会进一步卖给我们所需要的服务,以期能够满足处理速度的要求。从某种程度上来说,他们是对的,但是我们值得停下来思考片刻,并对手边的任务进行适当的再认识。    近年来,数据挖掘和机器学习在我们周围持续火爆,各种媒体也不断推送着海量的数据。但仔细观察就能发现,实际应用中的那些机器学习算法与多年前并没有什么两样,只是在应用的数据规模上有些不同罢了。历数一下产生数据的组织,至少在我看来,数目其实并不多。无非是Google、Facebook、Twitter、Netflix及其他为数不多的机构,在使用若干学习算法和工具,这些算法和工具使得他们能够对数据进行测试分析。那么,真正的问题是:“对于其他人,大数据框架下算法和工具的作用是什么呢?”    我承认本书将多次提及大数据和机器学习之间的关系,这是我无法忽视的一个客观问题,但它只是一个很小的因素,终极目标是如何利用可用数据获取数据的本质内涵。请记住,本书是在探讨工具,关键点是选择哪个工具来胜任我们尝试完成的工作。迫于技术上的压力,有人可能会选择Hadoop,但是Hadoop并不一定总是完成任务最好的选择。    本书目的本书是关于机器学习而非大数据的,书中会介绍多种用于分析数据本质的技术。读完本书,你将掌握许多有用的机器学习方法的实际运用,并分析、解释算法实现中如此组织代码的原因。针对具体实际问题选择哪种方法更恰当,本书会提供推荐的建议。    本书没有固定的阅读顺序。你可以从头读到尾,或者选择性地阅读你需要的内容。    “实践”意味着亲自动手过去的几年里,我读过的许多关于机器学习的书都非常重视理论,这并不是什么坏事。如果你正在看一本使用复杂公式、深入讲解数学理论的书,我要为你的严谨而喝彩。对于我而言,我更加关注的是使用何种机器学习方法及其工程实践。我的信条很简单:    在头脑中思考一个问题;找到我需要学习的理论;找到和我要学习的理论最相关的例子;在我的实践工程中让它们发挥作用。    作为软件开发人员,我个人喜欢看很多示例。作为一名老师,我喜欢尽可能多地亲自实现它,并且尽可能简单地将内容传授给我的学生。大概过程是:指出关键点,在IDE中输入正确的代码,然后实现期望的功能。这是令人振奋并且很有成就感的事情,并且我在本书中也希望传达这样的思想。    每个人都有自己的学习方式。我相信本书涵盖了大多数的通用方法,所以,相信每个人都能从中获益。    “如何对待数学?”    就像谈论“你最喜欢哪支足球队?”“吉他手吉米·佩奇(Jimmy Page)和杰夫·贝克(Jeff Beck)哪个更帅气(嘿,本人更喜欢贝克)?”有些话题是没有标准答案的。比如这个问题:在开始从事机器学习之前,我需要知道多少数学知识?从事机器学习和学习机器学习的理论是两个不同的概念。为了学习理论,显然需要一个好的数学背景。本书讨论机器学习的实践方法。现在已经有了很多可被开发者利用的机器学习工具,当前的重点不是为什么这些工具有用,而是如何让这些工具为我所用。前人已经完成了艰难的工作,我们要尊重他们的劳动成果,并为他们喝彩。    “但是你需要一个博士!”    同行的一些言语或许会葬送你的研究之路。在你开始做数据分析或者敢于自称是“数据科学家”的时候,耳边会长期充斥着关于你应该具备什么样的知识层次这样的争论(我将马上剖析“数据科学家”这个术语)。个人而言,我相信如果你能够花费多年去获得一个学士学位,接着获得硕士学位,然后是博士学位,你就可以选择这条路。我对待事情更加注重实用性,并且喜欢边阅读资料边动手实践。    学术环境很关键;现在有大量的在线课程、论文、网站,以及关于数学、统计、数据挖掘方面的书籍,足够让你跟上最新最热的思想。我从中获取了很多资源。    但是,对于我,最直接的莫过于甩开膀子,阅读大量书籍,尝试一些方法,并且检验它们的结果。如果你想重温一下线性回归的理论,我再次向你保证有很多资料可以阅读,本书也将介绍它们。    最后,大家能够成为“数据科学家”吗?或许本书更有可能的结果是:带给大家更多的机器学习实践技能。第2章将再次讨论这个话题。    所以,当办公室的其他人还在争论是否需要在项目组中增加几个博士的时候,你已经开始用代码实现一个决策树,并且检验它是否切实可行了。    最终你会学到什么假定你将本书从头读到尾,你将学到机器学习的常用策略、机器学习的不同方法,以及将它们应用在实时和批处理环境下的方法。    或者,你也可以直接参考你需要的某一个章节。本书各章节之间联系并不紧密,每一章的内容和实例与其他章节并无太多相关性。

商品参数
基本信息
出版社 机械工业出版社
ISBN 9787111593379
条码 9787111593379
编者 (美)詹森·贝尔(Jason Bell) 著;邹伟,王燕妮 译
译者 邹伟,王燕妮
出版年月 2018-04-01 00:00:00.0
开本 16开
装帧 平装
页数 302
字数
版次 1
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]