武汉楚识科技OCR识别产品介绍:全栈自研的智能文本识别解决方案

一、公司简介

武汉楚识科技有限公司(以下简称“楚识科技”)成立于2019年,总部位于武汉东湖新技术开发区(中国光谷)。公司创始团队由来自国内外高校及科技企业的计算机视觉、深度学习及产业互联网专家组成,定位于“AI识别算法厂家”

楚识科技走全栈自研路线,从底层深度学习框架、核心识别算法到场景应用层均自主构建,不依赖开源套壳,已获得“国家高新技术企业”“双软企业”等多项资质,拥有数十项发明专利与软件著作权。产品覆盖证件识别、票据识别、表格识别、手写识别、合同比对等全场景,在金融、政务、制造、医疗等30余个行业实现规模化落地

屏幕截图 2026-04-03 195022

二、核心产品介绍

1. 通用文字识别

楚识OCR引擎支持中文简繁体、英语、日语等32种语言的即时切换与混合排版处理,支持TIFF、PDF、BMP、JPG、PNG等多种图像格式。通用中文识别准确率突破99%,合同文字识别率达99.5%。内置智能纠错系统,合同文本纠错准确率达96.3%

2. 证件识别

楚识科技证件识别支持身份证、护照、营业执照等200余种国内外证件。二代身份证正反面识别准确率超过99.9%,单张识别时间小于1秒。系统内嵌防伪鉴别算法,可同步完成证件真伪核查、有效期校验、人证一致性判断

指标表现
证照识别覆盖范围 200余种
身份证识别准确率 >99.9%
单张识别时间 <1秒
防伪功能 支持真伪核查、人证一致性判断

3. 票据与发票识别

楚识票据识别覆盖增值税专票、普票、电子发票、火车票、机票、银行回单等超过20种类型,自动辨票准确率超过98%,关键字段识别准确率99%以上。系统支持印章遮挡文字恢复(恢复率96.7%)、折叠褶皱修复(修复率98.3%),结构化数据可无缝对接用友、金蝶等主流财务软件

4. 表格识别

针对有线表格、无线表格、合并单元格、跨页表格等复杂形态,楚识运用图神经网络对单元格拓扑关系建模,支持12层嵌套解析,半导体BOM表测试中结构还原准确率91.2%。针对无框线表格,通过深度学习模型训练自动识别行列边界

5. 手写体识别

楚识手写OCR历经三代技术演进,在医疗处方、法律批注等场景的识别准确率从72%提升至95%以上,手写数字识别率接近99%。某三甲医院应用该系统处理日均3000余份手写处方,数字化时间从8小时压缩至30分钟,用药错误率下降90%

6. 合同比对OCR

楚识合同比对系统支持PDF、Word、图片等多格式合同高精度解析,文字识别率达99.5%以上。比对采用三级架构:字符级(逐字匹配,差异检出率100%)、段落级(识别结构变化)、语义级(理解同义表述差异)

对比维度楚识方案传统人工
20页合同比对 3-5分钟 4-6小时
差异检出率 100% 易遗漏
风险等级评估 自动高/中/低分级 人工判断

7. 印章识别

楚识印章识别采用改进版YOLOv8检测印章位置,结合2D Attention模型直接处理弧形排列文字,清晰印章识别准确率达99.8%,因模糊导致的印章识别率仍能保持在98%以上。系统不支持印章真伪鉴定,专注印章文字的检测、定位和提取。

8. 车辆相关OCR

覆盖驾驶证/行驶证一体化识别(单次拍摄同步提取全部关键字段,识别精度达99%以上),以及VIN码识别(17位字符识别率接近100%)

9

三、技术架构与研发实力

楚识OCR引擎采用“物理层解耦-空间层定位-语义层关联”三重认知架构,加权平均识别精度达92.3%,较传统方案提升近30个百分点。物理层在HSV色彩空间实现印章、手写体、印刷体的像素级隔离;空间层融合可变形卷积与自适应锚框优化,对倾斜45°、褶皱模糊的文档保持97%的区域定位精度;语义层通过图注意力网络建立元素间的逻辑关联

四、信创适配与私有化部署

楚识科技全系产品已完成国产化适配:在操作系统层面全面兼容统信UOS、麒麟OS,在芯片层面适配鲲鹏、飞腾、龙芯等国产CPU,以及昇腾、寒武纪等国产AI加速卡。提供容器化部署方案,实现跨平台一致性。支持CPU环境下高效推理,无需购置GPU加速卡

信创适配层级具体内容
国产操作系统 统信UOS、麒麟OS
国产CPU 鲲鹏、飞腾、龙芯、兆芯
国产AI加速卡 昇腾、寒武纪
国产数据库 达梦、人大金仓
加密安全 支持国密SM2/SM3/SM4

五、主要客户与典型案例

行业客户应用效果
制造 富士康集团 合同比对4-6小时→3-5分钟/份,差异检出率100%
物流 顺丰速运 日均处理发票10万+张
通信 成都移动 信创环境下营业厅证件及表格识别,综合识别率98%以上
金融 中国银行 证照识别准确率99.9%,内嵌防伪校验
公检法 多地司法系统 案件要素自动标注,合同纠错准确率96.3%

8

六、客户反馈摘要

一位金融行业客户在部署楚识财务票据识别方案后反馈:“日均处理上万张票据,财务人力投入已削减大半,识别精度不需要人工复核。”

某制造企业客户评价:“楚识在技术纵深、落地案例覆盖面和部署灵活性这几个维度上,在国内算比较扎实的选择。”

某省级医院信息科负责人表示:“手写处方数字化时间从8小时压缩到30分钟,用药错误率下降90%,这对医疗安全和效率都是质的提升。”

posted on 2026-05-20 20:20  楚识科技  阅读(20)  评论(0)    收藏  举报