暂无商品咨询信息 [发表商品咨询]
"本书就乌金体藏文古籍文档图像分析与识别进行研究,全面、系统和深入地开展乌金体藏文古籍文档图像的预处理、版面分割、文本行切分、字符切分、文本识别、后处理、版面描述与复原的理论与方法,以及解决乌金体藏文古籍版面有污渍、边框、模糊,以及行之间的笔画粘连、行内字符之间的粘连等复杂现象中关键问题的算法和实践。
本书的特色是从具体乌金体藏文古籍识别的应用研究出发,利用已有的相关理论,结合具体问题,开展诸如文档图像二值化、行切分、字符切分等相关研究的数据集建设,以及对针对各种问题提出解决方案和有效算法,并进行实验分析等。使读者从理论、方法和实践有一个全面的认识和了解,并从中获得有意的启发。
本书可以作为相关专业研究生的参考书,以及从事模式识别、图像处理、OCR、文档图像分析与识别、古籍文档图像分析与识别等计算机信息处理研究的科研人员和从事产品开发的工程技术人员阅读和参考。
王维兰,女,西北民族大学二级教授、博导。曾在中山大学、清华大学和美国印地安那大学做访问学者。从事图像处理与模式识别、藏文信息处理等方面的教学与研究工作。先后主持国家自然基金项目5项、省部级科研项目7项;获授权发明专利8项,发表包括SCI、EI等学术论文120余篇;获甘肃省科技进步二等奖2项、作为参与人获国家科技进步二等奖2项,以及甘肃省高校科技奖、兰州市科技奖多项。中国计算机学会高级会员、中国图象图形学学会高级会员、文档图像分析与识别专委会常务委员。曾获甘肃省“青年教师成才奖”荣誉称号;2006年评为“甘肃省优秀专家”;入选2014年“国家民委领军人才支持计划人选”;作为带头人,入选2018年国家民委“少数民族数字媒体智能信息处理及应用创新团队”支持计划团队。在“图像处理与模式识别”、“智能信息处理与应用软件”等方向招生硕士研究生,在中国语言文学的语言与应用语言学方向招生博士研究生。为第十、十一、十二届甘肃省政协委员。
第1章绪论
1.1引言
1.2藏文古籍文档分析与识别研究的背景及意义
1.2.1研究背景
1.2.2研究意义
1.3乌金体藏文古籍文档分析与识别研究内容
1.4乌金体藏文及其结构特征
1.4.1藏文文字特点
1.4.2藏文音节
1.4.3梵音藏文
1.4.4藏文梵音藏文的部件
1.5藏文古籍字频统计
1.5.1字丁统计
1.5.2音节统计
1.6当前的研究现状以及发展趋势
1.6.1藏文识别技术
1.6.2藏文古籍文档识别
1.6.3藏文古籍数字化资源
1.7关于本书
参考文献
第2章乌金体藏文古籍分析与识别样本库建设
2.1引言
2.2乌金体藏文古籍分析与识别样本库建设进展
2.2.1识别字符集样本库的研究现状
2.2.2藏文梵音藏文识别研究现状
2.3乌金体藏文古籍样本库
2.3.1原始文档图像样本集
2.3.2古籍文档图像二值化样本集
2.4乌金体藏文古籍分析与识别样本组成
2.4.1版面分析样本库
2.4.2文本行、文本串样本库
2.4.3字丁样本库
2.5本章小结
参考文献
第3章藏文古籍文档图像的预处理
3.1引言
3.2藏文古籍文档图像预处理研究进展
3.2.1图像增强现状
3.2.2扭曲矫正现状
3.2.3文档图像二值化现状
3.3藏文古籍文档图像增强
3.3.1滤波器的方法
3.3.2视觉感知的方法
3.3.3亮度提升和均衡化的方法
3.3.4低照度古籍文档图像增强方法
3.3.5超分辨率古籍文档图像增强方法
3.4乌金体藏文古籍文档图像二值化
3.4.1古籍文档图像二值化的困难
3.4.2基于目标边缘的二值化
3.4.3基于Lab颜色空间的二值化
3.4.4改进的Attention U-Net二值化
3.5本章小结
参考文献
第4章乌金体藏文古籍文档图像版面分析
4.1引言
4.2藏文古籍文档图像版面分析研究进展
4.3基于全卷积神经网络的版面分析
4.3.1全卷积网络藏文古籍版面分析
4.3.2数据集及实验细节
4.3.3实验结果与分析
4.4基于DeepLab的藏文古籍版面分析
4.4.1网络模型结构
4.4.2标签数据及细节
4.4.3实验结果与分析
4.5基于实例分割的藏文古籍版面分析
4.5.1网络模型结构
4.5.2半自动数据集构建
4.5.3实验结果与分析
4.6基于多任务语义分割的藏文古籍版面分析
4.6.1问题分析
4.6.2研究动机
4.6.3网络模型结构
4.6.4版面分析数据集标注
4.6.5文本行预测与切分
4.6.6实验结果与分析
4.7本章小结
参考文献
第5章乌金体藏文古籍文档图像行切分
5.1引言
5.2藏文古籍文本行切分研究进展
5.3基于连通域重心与轮廓曲线跟踪的文本行切分
5.3.1连通域分析
5.3.2连通域外轮廓的计算
5.3.3连通域分配
5.3.4文本行切分
5.3.5实验结果与分析
5.4结合文字核心区域和扩展生长的藏文古籍文本行切分
5.4.1结合文字核心区域和扩展生长文本行切分流程
5.4.2文本行基线范围获取
5.4.3文字核心区域和伪文本连通区域形成
5.4.4文本行切分
5.4.5实验结果与分析
5.5基于连通区域分析和基线位置的文本行切分
5.5.1方法框架
5.5.2边框检测和移除
5.5.3基线检测
5.5.4文本行切分
5.5.5实验结果与分析
5.6基于局部基线检测的乌金体藏文古籍粘连行切分
5.6.1方法框架
5.6.2局部基线检测
5.6.3笔画粘连区域检测
5.6.4粘连区域切分
5.6.5连通域分配
5.6.6实验结果与分析
5.7本章小结
参考文献
第6章乌金体藏文古籍文档字符切分
6.1引言
6.2藏文古籍文档字符切分研究进展
6.3结合基线位置信息的乌金体藏文古籍字符切分
6.3.1字符切分框架
6.3.2基线上方字符部件的切分
6.3.3基线以下字符部件的切分
6.3.4实验结果分析与评价
6.4基于结构属性的乌金体藏文古籍文本字丁切分
6.4.1乌金体藏文古籍字丁切分的挑战
6.4.2文本行段的局部基线检测
6.4.3粘连笔画检测与切分
6.4.4断裂笔画归属
6.4.5字符切分结果分析
6.5本章小结
参考文献
第7章乌金体藏文古籍文本识别
7.1引言
7.2乌金体藏文古籍识别研究进展
7.2.1字符识别
7.2.2藏文字符识别情况
7.2.3古籍识别研究情况
7.3藏文古籍字符识别方案
7.3.1基于藏文部件的字丁识别
7.3.2单字丁识别
7.4文本行识别方案
7.4.1基于CRNN的识别
7.4.2基于SVTR的识别
7.5本章小结
参考文献
第8章藏文古籍文档图像版面描述及版面复原
8.1引言
8.2文档图像版面描述及版面复原进展
8.3藏文古籍文档图像版面分析、描述与复原框架
8.4基于XML的藏文古籍文档图像版面描述
8.4.1版面描述数据结构
8.4.2版面描述方法
8.5基于HTML的乌金体藏文古籍文档版面复原
8.5.1版面复原方法
8.5.2版面阅读顺序的确定
8.6藏文古籍版面分析系统设计与实现
8.6.1需求分析与系统设计
8.6.2系统实现
8.6.3藏文古籍文档图像版面分析系统测试
8.7本章小结
参考文献
附录A在乌金体藏文古籍分析与识别方面已授权相关发明专利
附录B藏文文档图像分析与识别相关的学位论文
附录C乌金体藏文古籍文档分析与识别算法研究相关数据集
基本信息 | |
---|---|
出版社 | 清华大学出版社 |
ISBN | 9787302676324 |
条码 | 9787302676324 |
编者 | 王维兰 著 |
译者 | -- |
出版年月 | 2024-12-01 00:00:00.0 |
开本 | 16开 |
装帧 | 平装 |
页数 | 320 |
字数 | 430000 |
版次 | 1 |
印次 | 1 |
纸张 | 80g纯质纸 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]