1、Contents01目录020301官员养廉OCR可复制可查询可录入个人信息表姓名:生日:银行卡卡号:身份证号码:地址:02表格印章文字信息元素(表格、图案、文字)检测户口登记机关户:0.52口:0.87专:0.90用:0.92KV输出户主姓名:王永*户号:509023*住址:杭州市西湖区*检测识别结构理解精准检测少量像素误差可能导致错误识别旧凝结卞1l/旦日一l招聘搬砖工:1产品经理:1领导:2公司介绍:下海登山亲轻而易举,上天入地无所不能。尺度变化大长边跨度1-2000,端边跨度5-200各种干扰遮挡、倾斜、弯曲、粘连、背景等精准检测真实场景中的文字检测案例字体&风格相似字&生僻字是汉字特
2、有的学术难题常用汉字个,覆盖书面资料370099%记录汉字个,常用姓名、地名 2100091000个80000个生僻字常用印刷字体有几百种古籍、手写字体多,上亿背景、噪声、扭曲、光照等风格变化真实场景中的文字识别案例一部书即一种字体10w以上字类,且类间差异小破损、印记、签注。识别并不是最终用户需求5101321986*输出的数字串是什么?用户有设定的问题:姓名是?结合空间和语义关系的结构理解身份证姓名:潘*住址:浙江省*身份证号码:510*生日:*性别:*民族:*解答用户问题卡证/表单的样式非常多,有常规通用性和自定义的单个卡证也存在打印错位、噪声干扰、拍摄扭曲等问题12435553KV输出
3、户主姓名:王永*户号:509023*住址:杭州市*签发日期:2016年*文本:内容、位置表格:位置、还原印章:位置、类型二维码:位置、信息元素输出输入图文字等元素检测文字识别输出结构理解(结合空间&语义关系)node:广义字段:通用图实体狭义字段:文本embeddingedge:node的空间距离GCN-图匹配网络GEMR-图实体聚合识别模型OCR图转文字文档产品卡证kv产品模板产品识别产品版面分析结构理解kv/表格/内容/顺序/智能模板kv结构自学平台高拍仪采集录入照片资料输入手机拍照STEP1 用户在APP中申请信贷,并通过手机拍照上传材料在线初审STEP2 审批人员根据拍照材料进行识别并
4、初审申请材料人工初审拒绝,补充材料STEP3 申请人将原材料提交至柜台,工作人员对材料进行扫描审批通过人工审核STEP4 放贷过程比对照片材料与扫描材料异同判断是否如期放款用户痛点:每份审批材料包含200多张图片,需要进行乱序比对,人工核对量大,误操作高现场录入高拍仪采集录入电子文档图片输入一体机服务器客户端读光OCR文档服务引擎政务应用系统(查看、检索、对比)各式纸质or图片文档印章标题表格段落文字文档中文本、表格、标题等元素和结构提取实现文档内容还原文件搜索、元素提取&校对、人机交互实现文档集间交叉对比文件图片搜索标题一致?印章一致?段落一致?人工确认印章:忽略文字:忽略文件系统批量文件元
5、素提取&校对读光OCR票据服务引擎定额发票火车票出租车票增值税发票机动车发票机票行程单类型:火车票出发站:株洲西站到达站:广州南站车次:G1127开车时间:2018年11月15日17:01开座位号:06车13C号票价:294.0类型:增值税发票金额:294.0纳税人识别号:239发票号码:3210494财务RPA系统2.调用OCR并读取识别结果3.自动录入报销系统4.自动进行发票验真与报税1.输入报销/报帐系统验真、报税系统数据录入各式报销材料1.票据框检测2.自动卡证分类器火车票出租票发票身份证行驶营业执照许可证增值税发票火车票3.智能模板类型:增值税发票金额:294.
6、0发票代码:4300181130发票号码:02857254售票方税号:239售票方名称:深圳市中兴新云服务有限公司发票详情:服务名称:*住宿服务*;金额:318.45;类型:火车票出发站:株洲西站到达站:广州南站车次:G1127开车时间:2018年11月15日17:01开座位号:06车13C号票价:294.0人工分类办理贷款、算蚂蚁积分、司法诉讼等都会提供大量卡证表单信息卡证分类是一个基础需求个人资质企业资质银行单据个人征信核验工商信息查询银行流水对账分类管理器可以实现数据归档同时是数据结构化的基础端到端的低成本标注方案结合空间和语义的结构理解通用kv模板:提取各式卡证结构用户输入:100-200张标注样本自学习:自动数据增强和模型训练上线:自动评测发布,实现批量调用身份证姓名:潘*住址:浙江省*火车票出发站:上海南站票价:66.88读光广泛应用于集团各种业务场景在云上我们服务了政府、金融、海关等各行业的用户