票据单据识别(Invoice Optical Character Recognition,Invoice OCR)基于行业前沿的深度学习技术,提供增值税发票识别、火车票识别、出租车票识别、机票行程单识别、运单识别等多种服务,支持将图片上的文字内容,智能识别为结构化的文本,可应用于企业票据报销、金融票据识别、快递单据录入等多种场景,大幅提升信息处理效率。

功能

腾讯云为您提供丰富多样的 OCR 识别服务,覆盖不同场景下的文字识别需求,且在不断开发新的功能。

增值税发票识别

支持增值税专用发票、增值税普通发票、增值税电子发票全字段的内容检测和识别,包括发票代码、发票号码、开票日期、合计金额、校验码、税率等。可以应用于财务报销、账单核对等各种需要提取票据信息的场景。

运单识别

支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。可应用于快递物流的电子运单识别录入等场景。

增值税发票(卷票)识别(免费公测版)

支持对增值税发票(卷票)的发票代码、发票号码、日期、校验码、合计金额(小写)等关键字段的识别。

定额发票识别(免费公测版)

支持定额发票的发票号码、发票代码及金额等关键字段的识别。

通用机打发票识别(免费公测版)

支持对通用机打发票的发票代码、发票号码、日期、购买方识别号、销售方识别号、校验码、小写金额等关键字段的识别。

火车票识别(免费公测版)

支持火车票全字段的识别,包括编号、票价、姓名、座位号、出发时间、出发站、到达站、车次、席别等。

出租车发票识别(免费公测版)

支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期等字段。

定额发票识别(免费公测版)

支持定额发票的发票号码、发票代码及金额等关键字段的识别。

机票行程单识别(免费公测版)

支持机票行程单关键字段的识别,包括姓名、身份证件号码、航班号、票价 、合计、电子客票号码、填开日期等。

汽车票识别(免费公测版)

支持识别公路汽车客票的发票代码、发票号码、日期、姓名、票价等字段。

轮船票识别(免费公测版)

支持识别轮船票的发票代码、发票号码、日期、姓名、票价等字段。

过路过桥费发票识别(免费公测版)

支持对过路过桥费发票的发票代码、发票号码、日期、小写金额等关键字段的识别。

购车发票识别(免费公测版)

支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。

完税证明识别(免费公测版)

支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。

混贴票据分类(免费公测版)

支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。

混贴票据识别(免费公测版)

支持多张、多类型票据的混合识别,系统自动实现分割、分类和识别。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共11种票据。

票据单据识别(Invoice Optical Character Recognition,Invoice OCR)基于行业前沿的深度学习技术,提供增值税发票识别、火车票识别、出租车票识别、机票行程单识别、运单识别等多种服务,支持将图片上的文字内容,智能识别为结构化的文本,可应用于企业票据报销、金融票据识别、快递单据录入等多种场景,大幅提升信息处理效率。

产品功能

增值税发票识别

支持增值税专用发票、增值税普通发票、增值税电子发票全字段的内容检测和识别,包括发票代码、发票号码、开票日期、合计金额、校验码、税率等。可以应用于财务报销、账单核对等各种需要提取票据信息的场景。

运单识别

支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。可应用于快递物流的电子运单识别录入等场景。

增值税发票(卷票)识别(免费公测版)

支持对增值税发票(卷票)的发票代码、发票号码、日期、校验码、合计金额(小写)等关键字段的识别。

定额发票识别(免费公测版)

支持定额发票的发票号码、发票代码及金额等关键字段的识别。

通用机打发票识别(免费公测版)

支持对通用机打发票的发票代码、发票号码、日期、购买方识别号、销售方识别号、校验码、小写金额等关键字段的识别。

火车票识别(免费公测版)

支持火车票全字段的识别,包括编号、票价、姓名、座位号、出发时间、出发站、到达站、车次、席别等。

出租车发票识别(免费公测版)

支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期等字段。

机票行程单识别(免费公测版)

支持机票行程单关键字段的识别,包括姓名、身份证件号码、航班号、票价 、合计、电子客票号码、填开日期等。

汽车票识别(免费公测版)

支持识别公路汽车客票的发票代码、发票号码、日期、姓名、票价等字段。

轮船票识别(免费公测版)

支持识别轮船票的发票代码、发票号码、日期、姓名、票价等字段。

过路过桥费发票识别(免费公测版)

支持对过路过桥费发票的发票代码、发票号码、日期、小写金额等关键字段的识别。

购车发票识别(免费公测版)

支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。

完税证明识别(免费公测版)

支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。

混贴票据分类(免费公测版)

支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。

混贴票据识别(免费公测版)

支持多张、多类型票据的混合识别,系统自动实现分割、分类和识别。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共11种票据。

产品优势

能力全面

支持十余种常见票据单据的识别,如增值税发票、定额发票、购车发票、火车票、出粗车发票、机票行程单、电子运单等,覆盖字段多、识别信息全面。

算法领先

各字段精度均处于业界领先水平,以增值税发票为例,发票代码、价税合计、合计金额、购买方识别号、开票日期等识别准确率达到99%以上。

场景丰富

支持单张票据、多张票据混贴识别,支持照片、扫描件识别,不受拍摄角度、背景、亮度、折痕、内容错位等不利因素干扰。

应用场景

企业财务报销

用于企业员工发票报销,通过 OCR 技术提取各种纸质发票、凭证上的发票号码、金额、发票代码等关键信息,支持数据录入和自动核对,减少人工校验成本。

金融票据管理

支持企业、银行、个人等多种支票、银行承兑汇票、商业承兑汇票以及进账单等金融票据的整单识别和切片识别,代替人工录入,提升处理效率。

生活记账理财

在理财记账、日程管理等应用中,通过 OCR 技术识别提取票据关键信息实现个人账单、出行日程的记录,辅助用户合理规划生活。

\

www.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cnwww.ksyuwei.cn

身份证 OCR 是如何收费的?

按调用接口次数收费,如身份证的正反面各识别1次,则计费2次,具体价格请查看 产品价格。

预付费资源包买错了可以退款或者换成其他资源包吗?

如果买错了文字识别的预付费资源包且未使用的,您可以联系腾讯云客服申请退款,退款后您可以选择所需的资源包重新购买。不支持更换至其他类型的资源包,也不支持有效期过后的剩余次数冻结。请付款前确认所需购买的资源包类型和数量。

免费资源包用完以后能否自动停服?

不支持免费资源包用完后自动停服。您可以根据资源包通知或登录控制台查看调用量以后,自行选择是否停止调用接口。

免费资源包用完以后将怎么收费?

免费资源包耗尽后,如果您已购买预付费资源包,则自动转入预付费资源包进行扣减。如果您未购买预付费资源包或者预付费资源包已耗尽,将自动转入后付费方式结算。具体请查看 计费概述。

免费资源包和预付费资源包快用完时是否有通知?

如果只有免费资源包,在免费资源包余额不足20%及额度耗尽时,会以短信、邮件、站内信的方式发送通知(目前有一定延迟)。如果您同时购买了某个服务的多个预付费资源包,则会在最后一个资源包额度不足20%及额度耗尽时发送通知。

文字识别服务的新老接口能共用资源包吗?

可以。文字识别产品下,只要是同一个服务,如通用印刷体识别,该服务的新老版本接口支持共用资源包。

注意:

文字识别 API 2017中的老版本接口我们仍在继续维护,但不支持新客户开通调用,建议您使用新版接口,体验更优服务。

我购买了通用印刷体识别资源包,通用印刷体识别(高速版)、通用印刷体识别(高精度版)接口都可以用吗?

不可以。通用印刷体识别、通用印刷体识别(高速版)、通用印刷体识别(高精度版)属于三个完全不同的接口,不同接口的资源包不支持混用。如果购买的资源包是通用印刷体识别,只能给通用印刷体识别接口使用。

文字识别服务支持子账号购买和使用资源包吗?

支持子账号购买,但需要复制链接由主账号支付。
子账号或主账号购买的资源包,主子账号调用都可扣减。子账号产生的调用量会计入主账号下,共享主/子账号购买的资源包,扣减顺序为资源包生效顺序。

文字识别的响应速度是多少?

一般在200ms - 1s内,识别时间会受图片大小、字数多少及网络环境影响。

文字识别的并发量是多少?

目前支持的并发量(QPS)在十几次到数十次不等,QPS 跟服务本身情况和机器性能有关。通常来说,大部分客户的日常调用是可以满足的,如因为活动等需要拓展 QPS,请 联系我们 并告知具体调用量情况。

通用文字识别支持的字数和字体大小上限是多少?

通用文字识别目前没有字数和字体大小限制。在图片高度1000px的条件下,单行字高48px左右效果比较好。

文字识别对上传的图片大小和清晰度有哪些要求?

  • 图片格式:支持 JPG、JPEG、PNG、BMP 等常规图片,不支持 GIF 类型的动图。

  • 图片大小:图片 Base64 大小不超过3MB。

  • 图片清晰度:建议在300 * 300px以上。

如何提高文字识别的准确性?

文字识别的准确性跟字体、拍照光线、清晰度等因素有关,建议图片文字清晰,光线自然无反光。
调用身份证识别时,建议身份证占图片比例应超过80%。

通用印刷体识别支持识别哪些语言?

通用印刷体识别 目前支持中文简体、繁体和英语、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。

文字识别返回的文字类型和存储方式是什么?

识别出来后返回的是 JSON 字符串,您可以自行选择存储的方式。

身份证识别支持识别中国香港和中国台湾的身份证吗?

身份证识别目前只支持识别中国内地(大陆)的居民身份证。

身份证识别支持核验身份证信息有效性吗?

身份证识别仅支持识别身份证正反面字段,具备翻拍、PS、复印件告警功能。您可以使用人脸核身的 身份信息认证接口,用于校验姓名和身份证号的真实性和一致性。

调用身份证识别接口时,为何返回的识别内容与实际身份证信息不符?

请使用未 PS 处理的身份证图片。身份证图片会转换成 base64 格式,如果您的身份证图片经过 PS 处理,最终识别的还是身份证原图。

通用印刷体识别能否支持古籍的内容?

不支持。因为古籍是从右到左、从上到下的阅读书写方式;而文字识别是从左到右、一行一行的识别方式,文字识别不支持更改识别顺序。

是否可以识别电子账单/商品吊牌数字/运动 App 的步数/商超货架商品信息等?

可以。您可以使用通用印刷体识别、通用印刷体识别(高精度版),准确率一般在93% 以上,不过根据使用场景的不同,准确率也有所差异。

是否可以识别银行汇票/保险单/手写的发票/个人征信报告?

可以。您可以使用通用印刷体和通用手写体识别,如需要定制化开发,请 联系我们 告知具体的使用场景和需求。

文字识别支持移动端离线操作吗?

文字识别目前不支持移动端离线操作。

文字识别支持私有化部署吗?

支持,请 联系我们 告知具体的使用场景和需求。

文字识别服务支持子账号调用吗?

支持。请联系您的主账号或拥有 QcloudCamFullAccess 权限的子账号在 访问管理控制台 为您授予文字识别(QcloudOCRFullAccess)权限,授权后在 新版文字识别控制台 开通相应的服务,即可调用该服务接口。

注意:

旧版智能图像-文字识别控制台不支持子账号访问,您需要使用 新版文字识别控制台。

子账号可以开通文字识别服务吗?

可以。实名认证后的主账号和被授予文字识别(QcloudOCRFullAccess)权限的子账号(包括子用户和协作者),均可以开通文字识别服务。且同一个 APPID 下的主/子账号,只要有一个账号开通了文字识别某项服务,其他账号都会自动开通该服务。

说明:

您可以在文档中心查看关于子用户和协作者的 用户类型 说明。

主账号如何给子账号授予文字识别权限?

您需要在 访问管理控制台 中操作。

  • 方法1:为您的子账号授权。
    在左侧导航栏选择【用户】>【用户列表】,再选择对应的子账号单击授权,关联“文字识别”预设策略。

  • 方法2:将“文字识别”预设策略,关联至您的子账号。
    在左侧导航栏选择【策略】,在搜索栏搜索“文字识别”预设策略,关联用户/组。

子账号如何获取 SecretId 和 SecretKey 来调用接口?

可联系您的主账号提供。由主账号在 访问管理控制台 左侧导航栏选择【访问密钥】>【API 密钥管理】,再选择对应的子账号【新建密钥】,将生成的 SecretId 和 SecretKey 提供给子账号使用。

文字识别服务支持子账号购买和使用资源包吗?

支持子账号购买,但需要复制链接由主账号支付。
子账号或主账号购买的资源包,主子账号调用都可扣减。子账号产生的调用量会计入主账号下,共享主/子账号购买的资源包,扣减顺序为资源包生效顺序。

子账号购买的资源包,在控制台能查到吗?

可以。当前文字识别控制台以 APPID 为维度来展示资源包管理页,即子账号登录控制台后,看到的资源包管理页信息和主账号看到的一致。
主账号和子账号购买的资源包,都会展示在资源包管理页中,主/子账号调用会共享资源包,扣减顺序为资源包生效顺序。

如果主/子账号同时开通文字识别服务,会获得多个免费资源包吗?

不会,主账号和其创建的子账号,开通文字识别服务后,每个月只会收到一个免费资源包,共享使用。

子账号调用文字识别接口产生的调用量,会怎么收费?

子账号产生的调用量会计入主账号下。在账单结算时,系统将按照主账号拥有的免费资源包 > 付费资源包 > 按量计费的顺序进行结算,即如果当月免费额度耗尽后,若主/子账号未购买预付费资源包或者预付费资源包也已耗尽,将直接转入后付费结算。

为什么子账号产生的调用量,跟控制台上看到的不一致?

因为当前文字识别控制台以 APPID 为维度来展示数据报表页,即子账号登录控制台后,看到的数据报表页和主账号看到的一致。当前文字识别某一项服务,所有主/子账号产生的调用量,都会统一计入主账号下合并展示,暂未做区分。


  • 名称: 票据单据识别InvoiceOCR
  • 关键词: 票据单据识别,增值税发票识别,文字识别,腾讯云