来也技术团队|来也智能文档处理系统中的印章识别实践
发布网友
发布时间:2024-09-17 07:58
我来回答
共1个回答
热心网友
时间:2024-09-28 07:33
来也技术团队在智能文档处理系统中成功实现了印章识别的实践,通过OCR技术自动化印章核验,显著提高了工作效率。印章识别在企业中的应用广泛,如合同比对、出入库审核和发票报销等场景,以往人工校验的繁琐流程得以简化。
印章识别面临独特挑战:印章样式多样,包括不同形状、字体和排布,背景干扰复杂,且印章图像质量受多种因素影响。处理流程一般包括位置检测和文字内容识别两个关键步骤。来也科技采用深度学习目标检测技术,如改进的yolov5,不仅定位印章位置,还同时输出形状和颜色信息,以提高识别准确性。
在文字识别部分,团队倾向于端到端的OCR方法,如Mask-TextSpotter系列、ABCNet和PGNet。这些模型通过联合训练,减少误差积累,提高识别效率。其中,TrOCR,尤其是其Transformer架构,因其预训练和大规模数据集,成为来也选择的印章文字识别模型。实验中,团队结合真实标注和合成数据,使用图像增强技术,如随机尺寸、角度旋转等,以模拟真实环境中的印章识别挑战。
在评估方面,来也团队定义了存在性F1和文字条目F1两个指标,确保模型在13个场景的真实印章数据上达到领先水准。印章识别已成功应用于来也智能文档处理平台,并提供在线demo供用户试用。作为智能自动化领域的领导者,来也科技助力企业实现自动化转型,提升办公效率。
热心网友
时间:2024-09-28 07:28
来也技术团队在智能文档处理系统中成功实现了印章识别的实践,通过OCR技术自动化印章核验,显著提高了工作效率。印章识别在企业中的应用广泛,如合同比对、出入库审核和发票报销等场景,以往人工校验的繁琐流程得以简化。
印章识别面临独特挑战:印章样式多样,包括不同形状、字体和排布,背景干扰复杂,且印章图像质量受多种因素影响。处理流程一般包括位置检测和文字内容识别两个关键步骤。来也科技采用深度学习目标检测技术,如改进的yolov5,不仅定位印章位置,还同时输出形状和颜色信息,以提高识别准确性。
在文字识别部分,团队倾向于端到端的OCR方法,如Mask-TextSpotter系列、ABCNet和PGNet。这些模型通过联合训练,减少误差积累,提高识别效率。其中,TrOCR,尤其是其Transformer架构,因其预训练和大规模数据集,成为来也选择的印章文字识别模型。实验中,团队结合真实标注和合成数据,使用图像增强技术,如随机尺寸、角度旋转等,以模拟真实环境中的印章识别挑战。
在评估方面,来也团队定义了存在性F1和文字条目F1两个指标,确保模型在13个场景的真实印章数据上达到领先水准。印章识别已成功应用于来也智能文档处理平台,并提供在线demo供用户试用。作为智能自动化领域的领导者,来也科技助力企业实现自动化转型,提升办公效率。