国内首份OCR白皮书重磅出炉,基于深度学习的OCR已成主流

2020-09-29 10:49 来源:中国电子银行网

9月28日,在工业和信息化部、北京市人民政府、国际电信联盟ITU-T指导的2020 AIIA人工智能开发者大会上,主办方正式发布国内首份智能文字识别(OCR)能力测评与应用白皮书。白皮书从OCR发展背景、技术沿革、产业发展现状、技术标准化、发展趋势等多个维度,对当前国内OCR产业进行了一次详细梳理,全面助推OCR技术产业化加速落地及可持续发展。

OCR是光学字符识别(Optical Character Recognition)的缩写,指利用机器将图像中手写体或印刷体的文本转换为计算机可以直接处理的格式。作为计算机视觉领域的重要分支,OCR典型应用是通过图像文字识别实现信息录入。同时,由于文字和符号包含丰富的语义信息,基于OCR提取文字信息继而进行分析,能够帮助机器更好地理解图像。

国内首份OCR白皮书重磅出炉,基于深度学习的OCR已成主流

OCR产业生态图

不难看出,OCR技术逐渐“下沉”为一项基本的能力,为上层不同的业务应用提供底层技术支撑。以腾讯云为代表的科技巨头和云计算厂商正在纷纷加速布局OCR,在满足自身内部业务需求的同时,不断对外开放先进的OCR能力,OCR已然成为科技巨头能力标配。

多行业场景成熟落地,首次发布OCR评测标准

在具体的落地应用层面,目前卡证识别、票据识别等标准场景文字识别已经相对成熟,手写文字识别在教育、物流等行业的应用也在不断扩大。复杂动态场景下的OCR技术和应用成为近两年的热门研究方向,比如在无人驾驶、机器人等场景利用OCR对视场中出现的文字进行识别等。

在此次发布的白皮书中,腾讯云也公布了其多项OCR领域的典型落地案例。

丰巢快递柜通过使用腾讯云联合腾讯优图实验室提供的身份证OCR技术,身份证字段识别准确率高达99%,大幅提高了用户寄件、取件的效率;宁波银行通过采用腾讯云联合腾讯优图实验室打造的智能票据OCR解决方案,将识别的字段准确率提升至90%以上,更好地满足了银行业务场景的需要。搜狗广告图片文本审核借助OCR产品服务帮助客户自动识别海量的图片文字内容,从而高效地进行广告图片违法内容识别,降低客户业务的违规风险。

值得一提的是,为全面降低OCR相关领域的应用门槛,避免出现鱼龙混杂局面,白皮书也首次公布OCR评测标准和规范。

今年4月,中国人工智能产业发展联盟制定了《OCR服务智能化分级技术要求和评估方法》,规定了OCR服务在功能、性能、安全等方面的技术要求以及评估方法。7月,OCR服务要求及评估方法在国际电信联盟ITU-T SG16组成功立项,标志着深度学习背景下的OCR评测方法已经逐渐被国际标准组织所接受。

在此之中,腾讯深度参与推动OCR领域技术革新和标准制定,帮助企业客观、全面地评价不同OCR服务能力。目前,由中国人工智能产业发展联盟指导,腾讯云开发的天鉴OCR服务引擎自动化评测平台,不仅能够为OCR技术供给方提供技术测试服务,也将发布OCR技术或产品的测试结果,为需求方提供客观公正的选型依据。

第一页 第二页 继续阅读