6月29日,据天眼查知识产权信息显示,北京君正集成电路股份有限公司申请了一项名为“提升OCR识别速度的方法”的专利,专利号为CN202211691238.4,申请日期为2022年12月。
专利摘要中指出,本发明提供了一种提升OCR识别速度的方法,具体步骤如下:
**第一步:标注字间空格数据**
由于空格检测的目标是字与字之间的空格,因此需要将OCR训练数据中的字间空格标注出来。由于训练模型的高度固定为32,但宽度不定,因此数据中的图像均为高度为32、宽度不等的一行字图片。对于中文,如果字间隔超过5个像素,则认为是空格并予以标注;对于英文,单词之间的间隔也标注为空格。
**第二步:训练字间空格模型**
采用DBNet框架,该框架不仅可以检测出文字的位置,还可以检测出字间空格的位置。网络会输出空格的位置和得分,得分范围为0到1之间的浮点数,得分越高表示该处为空格的可能性越大,且空格个数没有限制。
**第三步:挑选空格做分割**
根据筛选条件选择合适的空格结果作为分割点。
采用该方法,可以在不影响识别精度的基础上将OCR识别速度提升至原来的二分之一甚至三分之一。
本文来源:金融界,作者:情报员。
相关文章推荐阅读: