行业文档识别(Document Optical Character Recognition,Document OCR)基于行业前沿的深度学习技术,提供表单表格识别、体检报告识别、检验检查单识别、算式识别等多种行业文档识别服务,支持将图片上的文字内容,智能识别为结构化的文本,可应用于智能核保、智能理赔、试题批改等多种行业场景,大幅提升信息处理效率。

功能

腾讯云为您提供丰富多样的 OCR 识别服务,覆盖不同场景下的文字识别需求,且在不断开发新的功能。

表格识别

支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。

算式识别

支持作业算式题目的自动识别,目前覆盖 K12 学力范围内的 14 种题型,包括加减乘除四则运算、分数四则运算、竖式四则运算、脱式计算等。

行业文档识别(Document Optical Character Recognition,Document OCR)基于行业前沿的深度学习技术,提供表单表格识别、体检报告识别、检验检查单识别、算式识别等多种行业文档识别服务,支持将图片上的文字内容,智能识别为结构化的文本,可应用于智能核保、智能理赔、试题批改等多种行业场景,大幅提升信息处理效率。

产品功能

表格识别

支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。

算式识别

支持作业算式题目的自动识别,目前覆盖K12学力范围内的14种题型,包括加减乘除四则运算、分数四则运算、竖式四则运算、脱式计算等。

产品优势

能力全面

支持保险、教育、金融、医疗等各类行业文档和表单表格的高精度识别服务,返回结构化信息,助力行业自动化效率提升。

算法领先

基于业内领先的深度学习算法、表格文字的识别准确率在92%以上,算式识别的准确率在94%以上。

鲁棒性强

适应多场景、任意背景,模糊、可容忍透视畸变、光照不均等实际应用中存在的复杂场景,并可实现自动裁边、修正倾斜等。

应用场景

智能核保和理赔

支持体验报告内容结构化提取,结合 NLP 技术,帮助保险公司实现核保流程的自动化。通过识别各类保单中的关键字段和医疗单据中的明细信息,加速完成保险理赔业务。

数学作业批改

通过一次简单的拍照就可以对算式、公式、试题等数学作业进行自动识别,结合结果智能批改功能,有效地提高了老师和家长检查和批改作业的工作效率。

物流单据电子化

实现各类物流表单的快速识别和结构化信息提取,帮助客户进行纸质表单的自动化录入,有效提升流程效率和录入信息准确度。

www.ksyuwei.cn

www.ksyuwei.cn

www.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cn

身份证 OCR 是如何收费的?

按调用接口次数收费,如身份证的正反面各识别1次,则计费2次,具体价格请查看 产品价格。

预付费资源包买错了可以退款或者换成其他资源包吗?

如果买错了文字识别的预付费资源包且未使用的,您可以联系腾讯云客服申请退款,退款后您可以选择所需的资源包重新购买。不支持更换至其他类型的资源包,也不支持有效期过后的剩余次数冻结。请付款前确认所需购买的资源包类型和数量。

免费资源包用完以后能否自动停服?

不支持免费资源包用完后自动停服。您可以根据资源包通知或登录控制台查看调用量以后,自行选择是否停止调用接口。

免费资源包用完以后将怎么收费?

免费资源包耗尽后,如果您已购买预付费资源包,则自动转入预付费资源包进行扣减。如果您未购买预付费资源包或者预付费资源包已耗尽,将自动转入后付费方式结算。具体请查看 计费概述。

免费资源包和预付费资源包快用完时是否有通知?

如果只有免费资源包,在免费资源包余额不足20%及额度耗尽时,会以短信、邮件、站内信的方式发送通知(目前有一定延迟)。如果您同时购买了某个服务的多个预付费资源包,则会在最后一个资源包额度不足20%及额度耗尽时发送通知。

文字识别服务的新老接口能共用资源包吗?

可以。文字识别产品下,只要是同一个服务,如通用印刷体识别,该服务的新老版本接口支持共用资源包。

注意:

文字识别 API 2017中的老版本接口我们仍在继续维护,但不支持新客户开通调用,建议您使用新版接口,体验更优服务。

我购买了通用印刷体识别资源包,通用印刷体识别(高速版)、通用印刷体识别(高精度版)接口都可以用吗?

不可以。通用印刷体识别、通用印刷体识别(高速版)、通用印刷体识别(高精度版)属于三个完全不同的接口,不同接口的资源包不支持混用。如果购买的资源包是通用印刷体识别,只能给通用印刷体识别接口使用。

文字识别服务支持子账号购买和使用资源包吗?

支持子账号购买,但需要复制链接由主账号支付。
子账号或主账号购买的资源包,主子账号调用都可扣减。子账号产生的调用量会计入主账号下,共享主/子账号购买的资源包,扣减顺序为资源包生效顺序。

文字识别的响应速度是多少?

一般在200ms - 1s内,识别时间会受图片大小、字数多少及网络环境影响。

文字识别的并发量是多少?

目前支持的并发量(QPS)在十几次到数十次不等,QPS 跟服务本身情况和机器性能有关。通常来说,大部分客户的日常调用是可以满足的,如因为活动等需要拓展 QPS,请 联系我们 并告知具体调用量情况。

通用文字识别支持的字数和字体大小上限是多少?

通用文字识别目前没有字数和字体大小限制。在图片高度1000px的条件下,单行字高48px左右效果比较好。

文字识别对上传的图片大小和清晰度有哪些要求?

  • 图片格式:支持 JPG、JPEG、PNG、BMP 等常规图片,不支持 GIF 类型的动图。

  • 图片大小:图片 Base64 大小不超过3MB。

  • 图片清晰度:建议在300 * 300px以上。

如何提高文字识别的准确性?

文字识别的准确性跟字体、拍照光线、清晰度等因素有关,建议图片文字清晰,光线自然无反光。
调用身份证识别时,建议身份证占图片比例应超过80%。

通用印刷体识别支持识别哪些语言?

通用印刷体识别 目前支持中文简体、繁体和英语、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。

文字识别返回的文字类型和存储方式是什么?

识别出来后返回的是 JSON 字符串,您可以自行选择存储的方式。

身份证识别支持识别中国香港和中国台湾的身份证吗?

身份证识别目前只支持识别中国内地(大陆)的居民身份证。

身份证识别支持核验身份证信息有效性吗?

身份证识别仅支持识别身份证正反面字段,具备翻拍、PS、复印件告警功能。您可以使用人脸核身的 身份信息认证接口,用于校验姓名和身份证号的真实性和一致性。

调用身份证识别接口时,为何返回的识别内容与实际身份证信息不符?

请使用未 PS 处理的身份证图片。身份证图片会转换成 base64 格式,如果您的身份证图片经过 PS 处理,最终识别的还是身份证原图。

通用印刷体识别能否支持古籍的内容?

不支持。因为古籍是从右到左、从上到下的阅读书写方式;而文字识别是从左到右、一行一行的识别方式,文字识别不支持更改识别顺序。

是否可以识别电子账单/商品吊牌数字/运动 App 的步数/商超货架商品信息等?

可以。您可以使用通用印刷体识别、通用印刷体识别(高精度版),准确率一般在93% 以上,不过根据使用场景的不同,准确率也有所差异。

是否可以识别银行汇票/保险单/手写的发票/个人征信报告?

可以。您可以使用通用印刷体和通用手写体识别,如需要定制化开发,请 联系我们 告知具体的使用场景和需求。

文字识别支持移动端离线操作吗?

文字识别目前不支持移动端离线操作。

文字识别支持私有化部署吗?

支持,请 联系我们 告知具体的使用场景和需求。

文字识别服务支持子账号调用吗?

支持。请联系您的主账号或拥有 QcloudCamFullAccess 权限的子账号在 访问管理控制台 为您授予文字识别(QcloudOCRFullAccess)权限,授权后在 新版文字识别控制台 开通相应的服务,即可调用该服务接口。

注意:

旧版智能图像-文字识别控制台不支持子账号访问,您需要使用 新版文字识别控制台。

子账号可以开通文字识别服务吗?

可以。实名认证后的主账号和被授予文字识别(QcloudOCRFullAccess)权限的子账号(包括子用户和协作者),均可以开通文字识别服务。且同一个 APPID 下的主/子账号,只要有一个账号开通了文字识别某项服务,其他账号都会自动开通该服务。

说明:

您可以在文档中心查看关于子用户和协作者的 用户类型 说明。

主账号如何给子账号授予文字识别权限?

您需要在 访问管理控制台 中操作。

  • 方法1:为您的子账号授权。
    在左侧导航栏选择【用户】>【用户列表】,再选择对应的子账号单击授权,关联“文字识别”预设策略。

  • 方法2:将“文字识别”预设策略,关联至您的子账号。
    在左侧导航栏选择【策略】,在搜索栏搜索“文字识别”预设策略,关联用户/组。

子账号如何获取 SecretId 和 SecretKey 来调用接口?

可联系您的主账号提供。由主账号在 访问管理控制台 左侧导航栏选择【访问密钥】>【API 密钥管理】,再选择对应的子账号【新建密钥】,将生成的 SecretId 和 SecretKey 提供给子账号使用。

文字识别服务支持子账号购买和使用资源包吗?

支持子账号购买,但需要复制链接由主账号支付。
子账号或主账号购买的资源包,主子账号调用都可扣减。子账号产生的调用量会计入主账号下,共享主/子账号购买的资源包,扣减顺序为资源包生效顺序。

子账号购买的资源包,在控制台能查到吗?

可以。当前文字识别控制台以 APPID 为维度来展示资源包管理页,即子账号登录控制台后,看到的资源包管理页信息和主账号看到的一致。
主账号和子账号购买的资源包,都会展示在资源包管理页中,主/子账号调用会共享资源包,扣减顺序为资源包生效顺序。

如果主/子账号同时开通文字识别服务,会获得多个免费资源包吗?

不会,主账号和其创建的子账号,开通文字识别服务后,每个月只会收到一个免费资源包,共享使用。

子账号调用文字识别接口产生的调用量,会怎么收费?

子账号产生的调用量会计入主账号下。在账单结算时,系统将按照主账号拥有的免费资源包 > 付费资源包 > 按量计费的顺序进行结算,即如果当月免费额度耗尽后,若主/子账号未购买预付费资源包或者预付费资源包也已耗尽,将直接转入后付费结算。

为什么子账号产生的调用量,跟控制台上看到的不一致?

因为当前文字识别控制台以 APPID 为维度来展示数据报表页,即子账号登录控制台后,看到的数据报表页和主账号看到的一致。当前文字识别某一项服务,所有主/子账号产生的调用量,都会统一计入主账号下合并展示,暂未做区分。


  • 名称: 行业文档识别DocumentOCR
  • 关键词: 行业文档识别,表格识别,文字识别,腾讯云