ISBN/价格: | CNY20.00 (估\呈缴)学位论文 |
---|---|
作品语种: | chi |
出版国别: | CN 530000 |
题名责任者项: | 基于分割的农资图像文本检测算法研究/.殷昌山著/.杨林楠指导 |
出版发行项: | 2023.5.26 |
载体形态项: | 46页:;+图表:;+30cm |
一般附注: | 大数据学院(信息工程学院), 学号2020210459 |
提要文摘: | 农资图像中的文本信息为消费者购买农资提供了重要依据, 也有助于农资安全 监管执法部门检测和分析潜在的农资安全问题。 农资图像中文本的检测可以帮助农 资安全监管执法部门改进手工纸本记录监管方式,提高执法效率, 因此, 农资图像 文本检测对于农资安全监管和识别农资内容具有较大的研究意义。 然而, 目前并未 有公开的农资图像数据集,同时农资图像中的文本检测还面临诸多挑战,如图像背 景复杂、图像失真、文本形状尺寸不一等, 并且现有的算法在检测文本的效果上还 有待提升。 针对以上问题, 论文主要研究内容如下: (1)针对缺乏农资图像文本检测数据集, 论文构建了含有 708 幅图像和 11322 个文本框的数据集, 标注方式为由若干个坐标点顺时针连接构成的多边形, 并用自 助采样法划分数据集。 ( 2) 针对农资图像文本检测的准确性问题,论文提出了一种基于注意力机制 的农资图像文本检测算法, 论文选取了提取特征能力更强的骨干网络,并设计双特 征融合模块来整合局部和全局上下文的特征表示,加强对不同层级文本特征的提取, 最后通过缩放式扩展算法的后处理生成预测文本框,得到最终的检测结果。 该算法 可以准确框选出农资图像文本区域,在农资图像数据集上的准确率、 召回率和 F 分 数分别为 91.4%、 87.3%和 89.3%, 均高于对比算法。 (3) 针对农资图像文本检测的快速性问题, 论文提出了一个基于 Ghost 模块的 农资图像文本检测算法, 论文用参数更低的轻量级网络来提取基础特征, 引入多尺 度特征融合模块来获得多层之间的特征融合, 并采用可微分二值化后处理算法预测 文本, 使其能够快速地检测农资图像中的文本。 实验结果表明, 该算法在农资图像 数据集上的准确率基本达到了主流算法的水平, 检测速度达到 18.6FPS,参数量为 2.99M, 可以移植到移动端上并进行快速地检测, 论文最终将此算法部署到移动端 设备上并成功运行。 |
并列题名: | Research on Text Detection Algorithm of AgriculturalMaterials Image Based on Segmentation eng |
题名主题: | 文本检测 深度学习 特征融合 分割 注意力机制 学位论文 |
中图分类: | TP391.43-533 |
个人名称等同: | 殷昌山 著 |
个人名称次要: | 杨林楠 指导 |
团体名称等同: | 云南农业大学 授予 |
记录来源: | CN YNAUL 20240520 |