root 079379557a init 1 jaar geleden
..
PCB字符识别 079379557a init 1 jaar geleden
光功率计数码管字符识别 079379557a init 1 jaar geleden
README.md 079379557a init 1 jaar geleden
README_en.md 079379557a init 1 jaar geleden
中文表格识别.md 079379557a init 1 jaar geleden
包装生产日期识别.md 079379557a init 1 jaar geleden
印章弯曲文字识别.md 079379557a init 1 jaar geleden
发票关键信息抽取.md 079379557a init 1 jaar geleden
多模态表单识别.md 079379557a init 1 jaar geleden
快速构建卡证类OCR.md 079379557a init 1 jaar geleden
手写文字识别.md 079379557a init 1 jaar geleden
扫描合同关键信息提取.md 079379557a init 1 jaar geleden
液晶屏读数识别.md 079379557a init 1 jaar geleden
蒙古文书籍文字识别.md 079379557a init 1 jaar geleden
轻量级车牌识别.md 079379557a init 1 jaar geleden
高精度中文识别模型.md 079379557a init 1 jaar geleden

README.md

English | 简体中文

OCR产业范例20讲

PaddleOCR场景应用覆盖通用,制造、金融、交通等行业的主要OCR垂类应用,基于PP-OCR、PP-Structure的通用能力和各类垂类场景中落地的经验,PaddleOCR联合北京师范大学副教授柯永红、云南省能源投资集团财务有限公司智能化项目经理钟榆星、信雅达科技股份有限公司高级研发工程师张少华、郑州三晖电气股份有限公司工程师郭媛媛、福建中烟工业有限责任公司工程师顾茜、内蒙古阿尔泰电子信息技术有限公司CTO欧日乐克、安科私(北京)科技有限公司创始人柯双喜等产学研同仁共同开源《OCR产业范例20讲》电子书,通过Notebook的形式系统展示OCR在产业界应用的具体场景的调优过程与落地经验,为开发者快速落地OCR应用提供示范与启发。该书包含以下特点:

  • 20例OCR在工业、金融、教育、交通等行业的关键场景应用范例;
  • 覆盖从问题抽象、数据处理、训练调优、部署应用的全流程AI落地环节,为开发者提供常见的OCR优化思路;
  • 每个范例配有交互式Notebook教程,通过代码展示获得实际结果,便于学习修改与二次开发;
  • GitHub和AI Studio上开源本书中涉及的范例内容和代码,方便开发者学习和使用。

教程文档

《OCR产业范例20讲》中包含如下教程。如需获取整合后的电子版,请参考资料下载

通用

类别 亮点 模型下载 教程 示例图
高精度中文识别模型SVTR 比PP-OCRv3识别模型精度高3%,
可用于数据挖掘或对预测效率要求不高的场景。
模型下载 中文/English
手写体识别 新增字形支持 模型下载 中文/English
蒙文识别 新语种识别支持 即将开源 中文/English
甲骨文识别 新语种识别支持 模型下载 中文/English

制造

类别 亮点 模型下载 教程 示例图
数码管识别 数码管数据合成、漏识别调优 模型下载 中文/English
液晶屏读数识别 检测模型蒸馏、Serving部署 模型下载 中文/English
包装生产日期 点阵字符合成、过曝过暗文字识别 模型下载 中文/English
PCB文字识别 小尺寸文本检测与识别 模型下载 中文/English
电表识别 大分辨率图像检测调优 模型下载 中文/English
液晶屏缺陷检测 非文字字符识别 模型下载 中文/English

金融

类别 亮点 模型下载 教程 示例图
表单VQA 多模态通用表单结构化提取 模型下载 中文/English
增值税发票 关键信息抽取,SER、RE任务训练 模型下载 中文/English
印章检测与识别 端到端弯曲文本识别 模型下载 中文/English
通用卡证识别 通用结构化提取 模型下载 中文/English
银行电子回单 回单关键信息抽取 --- 中文/English
身份证识别 结构化提取、图像阴影 模型下载 中文/English
合同比对 文本检测参数调整、NLP关键信息抽取 --- 中文/English
研报识别与实体统计 密集文本检测、NLP实体识别 模型下载 中文/English
通用表格识别 表格数据生成 --- 中文/English

交通

类别 亮点 模型下载 教程 示例图
车牌识别 多角度图像、轻量模型、端侧部署 模型下载 中文/English
驾驶证/行驶证识别 尽请期待
快递单识别 尽请期待

资料下载

如需下载《OCR产业范例20讲》和上述场景中已经训练好的垂类模型,可以扫描下方二维码,关注公众号填写问卷后,加入PaddleOCR官方交流群获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)

如果您是企业开发者且未在上述场景中找到合适的方案,可以填写OCR应用合作调研问卷,免费与官方团队展开不同层次的合作,包括但不限于问题抽象、确定技术方案、项目答疑、共同研发等。如果您已经使用PaddleOCR落地项目,也可以填写此问卷,与飞桨平台共同宣传推广,提升企业技术品宣。期待您的提交!

traffic