君正突破OCR速度瓶颈:识别效率提升可达三倍!


6月29日,据天眼查知识产权信息显示,北京君正集成电路股份有限公司申请了一项名为“提升OCR识别速度的方法”的专利,专利号为CN202211691238.4,申请日期为2022年12月。

专利摘要中指出,本发明提供了一种提升OCR识别速度的方法,具体步骤如下:

**第一步:标注字间空格数据**

由于空格检测的目标是字与字之间的空格,因此需要将OCR训练数据中的字间空格标注出来。由于训练模型的高度固定为32,但宽度不定,因此数据中的图像均为高度为32、宽度不等的一行字图片。对于中文,如果字间隔超过5个像素,则认为是空格并予以标注;对于英文,单词之间的间隔也标注为空格。

**第二步:训练字间空格模型**

采用DBNet框架,该框架不仅可以检测出文字的位置,还可以检测出字间空格的位置。网络会输出空格的位置和得分,得分范围为0到1之间的浮点数,得分越高表示该处为空格的可能性越大,且空格个数没有限制。

**第三步:挑选空格做分割**

根据筛选条件选择合适的空格结果作为分割点。

采用该方法,可以在不影响识别精度的基础上将OCR识别速度提升至原来的二分之一甚至三分之一。

本文来源:金融界,作者:情报员。

相关文章推荐阅读:
  • 演员朱一龙主演电影票房突破110亿
  • 3D打印新突破!曼大等提出DQN多样化图形路径规划器:锐角转
  • 2025年湖南省绿色智能计算产业规模预计将突破1万亿元
  • 豆包视频生成大模型正式发布 首次突破多主体互动难关
  • 证监会:对突破关键核心技术的科技型企业并购重组实施绿色通道
  • 多路资金抢筹 雄帝科技封板涨停
    上一篇 2024年07月18日
    捷邦科技6.28龙虎榜:机构博弈 游资出逃
    下一篇 2024年07月18日
    版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 1094474542@qq.com 举报,一经查实,本站将立刻删除。

    相关推荐