热门搜索: 中考 高考 考试 开卷17
服务电话 024-96192/23945006
 

深度实践OCR:基于深度学习的文字识别

编号:
wx1202067126
销售价:
¥78.32
(市场价: ¥89.00)
赠送积分:
78
商品介绍

(1)作者阵容豪华,由阿里巴巴本地生活研究院算法团队技术专家领衔,海康威视、趣头条等企业的算法专家以及知名场景文本算法作者共同撰写。(2)行业应用和学术理论相结合,既有来自于阿里巴巴本地生活实际应用场景的一线实践经验和方法,又有来自学术前沿的新理论(3)本书得到了阿里巴巴本地生活、达摩院、旷视科技、字节跳动、狗尾草等知名AI企业或机构的知名AI技术专家的联袂推荐(4)本书不仅讲解了OCR的组件、方法、算法、实现,而且还介绍了学术界*前沿的文字检测和文字识别方法。

内容简介这是一部融合了企业界优选工程实践经验和学术界前沿技术和思想的ORC著作。本书由阿里巴巴本地生活研究院算法团队技术专家领衔,从组件、算法、实现、工程应用等维度系统讲解基于深度学习的OCR技术的原理和落地。书中一步步剖析了算法背后的数学原理,提供大量简洁的代码实现,帮助读者从零基础开始构建OCR算法。全书共9章:章从宏观角度介绍了ORC技术的发展历程、概念和产业应用;第2章讲解了OCR的图像预处理方法;第3~4章介绍了传统机器学习方法和深度学习的相关基础;第5章讲解了基于传统方法和深度学习方法的OCR的数据生成;第6章讲解了与OCR相关的一些不错深度学习方法,方便读者理解后续的检测和识别部分;第7章讲解了文字的检测技术,从通用的目标检测到文字的检测,一步步加深读者对文字检测问题的认识;第8章讨论了文字识别的相关技术,定位到文字的位置之后,需要对文字的内容进行进一步的解析;第9章介绍了一些OCR后处理的方法。

作者简介刘树春阿里巴巴本地生活研究院算法专家,前复旦七牛云联合实验室OCR算法负责人,在OCR相关技术的落地和实现方面有深入的研究和丰富的实践经验,在菜单识别、车牌检测识别、卡证识别、商业广告文字检测和识别、票据类识别等应用场景中积累了丰富的经验。曾经组队参加COCO竞赛、ICDAR刷榜等活动,并发表多篇很好论文。贺盼佛罗里达大学在读博士,担任 CVPR、ICCV、ECCV等10多家靠前顶会审稿人或程序委员,在场景文本领域发表过多篇靠前会议论文 (DTRN、CTPN、SSTD等)。曾经在中科院优选技术研究院、港中文、旷世美国研究院等做过相关研究工作,对场景文本有深刻的认识,并且对场景文本学术前沿有很强的感知力。马建奇的RRPN算法的作者,发表过多篇靠前会议论文,曾经在旷世研究院做过检测相关的工作,在上海高等研究院做过文字检测相关的工作,曾经组队参加过ICDAR 17 MLT比赛,获得前三名。曾获Facebook研究实习机会。目前即将开始修读博士学位,正在做文字识别相关的工作,对于OCR的问题有独到的见解。王佳军阿里巴巴本地生活研究院不错算法专家,负责本地生活研究院图像算法团队的管理、研发等工作,曾经在滴滴研究院做相关算法的研究。业余时间担任深度学习框架MXNet的技术专家,对实际算法的落地优化等有很好深入的耕耘,具有很强的OCR相关项目的落地能力。谢雨飞趣头条算法工程师,曾在七牛云做OCR、NLP相关算法的研究工作,发表过多篇靠前论文。陈明曦纽约大学硕士研究生,曾在七牛云从事OCR相关工作,发表相关论文数篇。

推荐序前言章  绪论 11.1  人工智能大潮中的OCR发展史 11.1.1  传统OCR方法一般流程 31.1.2  基于深度学习OCR方法一般流程 51.2  文字检测 61.3  文字识别 81.4  产业应用现状 101.5  本章小结 111.6  参考文献 11第2章  图像预处理 132.1  二值化 132.1.1  全局阈值方法 132.1.2  局部阈值方法 172.1.3  基于深度学习的方法 202.1.4  其他方法 222.2  平滑去噪 262.2.1  空间滤波 262.2.2  小波阈值去噪 282.2.3  非局部方法 292.2.4  基于神经网络的方法 332.3  倾斜角检测和校正 352.3.1  霍夫变换 362.3.2  Radon 变换 382.3.3  基于 PCA 的方法 382.4  实战 392.5  参考文献 43第3章  传统机器学习方法绪论 453.1  特征提取方法 453.1.1  基于结构形态的特征提取 453.1.2  基于几何分布的特征提取 613.2  分类方法模型 633.2.1  支持向量机 633.2.2  K近邻算法 653.2.3  多层感知器 703.3  实战:身份证号码的识别 713.3.1  核心代码 713.3.2  测试结果 783.4  本章小结 793.5  参考文献 79第4章  深度学习基础知识 804.1  单层神经网络 804.1.1  神经元 804.1.2  感知机 814.2  双层神经网络 824.2.1  双层神经网络简介 824.2.2  常用的激活函数 834.2.3  反向传播算法 864.3  深度学习 874.3.1  卷积神经网络 884.3.2  常用优化算法 904.4  训练网络技巧 924.4.1  权值初始化 924.4.2  L1/L2正则化 934.4.3  Dropout 944.5  实战 954.6  参考文献 97第5章  数据生成 995.1  背景介绍 995.2  传统单字OCR数据生成 1005.3  基于深度学习的OCR数据生成 1015.3.1  文字检测数据的生成 1015.3.2  检测图片生成 1035.3.3  其他方法 1125.3.4  识别数据生成 1135.4  通过GAN的技术生成数据 1145.4.1  GAN背景介绍 1145.4.2  GAN的原理 1165.4.3  GAN的变种 1175.5  图像增广 1235.5.1  常用的图像增强方法 1235.5.2  深度学习方法 1265.6  常用的开源数据集 1285.7  ICDAR的任务和数据集 1315.8  本章小结 1385.9  参考文献 138第6章  深度学习不错方法 1406.1  图像分类模型 1406.1.1  LeNet5 1406.1.2  AlexNet 1426.1.3  VGGNet 1436.1.4  GoogLeNet 1446.1.5  ResNet 1476.1.6  DenseNet 1516.1.7  SENet 1536.1.8  轻量化网络 1546.2  循环神经网络 1546.2.1  RNN网络 1546.2.2  GRU 1566.2.3  GRU的实现 1586.2.4  LSTM网络 1606.3  Seq2Seq 1636.4  CTC Loss 1646.4.1  算法详解 1666.4.2  前向传播 1686.4.3  后向传播 1736.4.4  前向/后向算法 1736.4.5  CTC算法特性 1746.4.6  代码解析 1756.5  Attention 1786.6  本章小结 1816.7  参考文献 182第7章  文字检测 1837.1  研究意义 1837.2  目标检测方法 1857.2.1  目标检测相关术语 1867.2.2  传统检测方法 1897.2.3  Two-stage 方法 1957.2.4  One-stage 方法 2107.3  文本检测方法 2177.3.1  传统文本检测方法 2177.3.2  基于深度学习的文本检测方法 2227.4  本章小结 2287.5  参考文献 228第8章  字符识别 2328.1  任务概览 2328.2  数据集说明 2338.2.1  数据集意义 2338.2.2  常见识别数据集介绍 2348.3  评测指标 2388.3.1  编辑距离 2398.3.2  归一化编辑距离 2398.3.3  字符准确度 2398.3.4  词准确率 2398.3.5  语境相关的评测方式 2398.4  主流算法介绍 2408.4.1  传统光学方法 2408.4.2  完全基于深度学习的方法 2448.5  CRNN模型实战 2748.5.1  简介 2748.5.2  运行环境 2748.5.3  测试部分讲解 2748.5.4  测试运行结果 2798.5.5  训练部分 2798.5.6  用ICDAR2013数据集训练CRNN模型 2828.6  本章小结 2848.7  参考文献 285第9章  OCR后处理方法 2889.1  文本纠错 2889.1.1  BK-tree 2899.1.2  基于语言模型的中文纠错 2939.2  文本结构化 2979.2.1  模板匹配 2989.2.2  文本分类 3009.3  本章小结 3049.4  参考文献 3040章  版面分析 30610.1  版面分析详解 30610.2  复杂版面识别 30910.3  文档恢复 31010.4  本章小结 31110.5  参考文献 311

商品参数
基本信息
出版社 机械工业出版社
ISBN 9787111654049
条码 9787111654049
编者 刘树春 贺盼 马建奇 王佳军 等
译者 --
出版年月 2020-05-01 00:00:00.0
开本 16开
装帧 平装
页数 324
字数 128
版次 1
印次 1
纸张 一般胶版纸
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]