GithubHelp home page GithubHelp logo

turnerrussell50 / rapidocr Goto Github PK

View Code? Open in Web Editor NEW

This project forked from rapidai/rapidocr

0.0 0.0 0.0 18.04 MB

A cross platform OCR Library based on PaddleOCR & OnnxRuntime & OpenVINO.

License: Apache License 2.0

Shell 0.93% C++ 54.69% Python 23.70% C 0.64% Java 0.65% C# 5.53% Kotlin 9.29% CSS 0.48% HTML 1.86% CMake 0.67% Batchfile 0.95% Jupyter Notebook 0.60%

rapidocr's Introduction

RapidOCR (捷智OCR- 信创级开源OCR - 为世界内容安全贡献力量)

简体中文 | English

Open in Colab
PyPI

目录

商业支持

  • 提供信创平台多架构,包括Arm/X86/mips(龙芯)/RISC-V等信创CPU支持,同时兼容ONNXRuntime/OpenVINO/NCNN
  • 有意者邮件联系: [email protected], 请先邮件咨询服务项目,即时回复联系方式。

简介

  • 💖目前已知运行速度最快、支持最广,完全开源免费并支持离线快速部署的多平台多语言OCR。
  • 中文广告: 欢迎加入我们的QQ群下载模型及测试程序,QQ群号:887298230
  • 缘起:百度paddlepaddle工程化不是太好,为了方便大家在各种端上进行ocr推理,我们将它转换为onnx格式,使用Python/C++/Java/Swift/C# 将它移植到各个平台。
  • 名称来源: 轻快好省并智能。基于深度学习技术的OCR技术,主打人工智能优势及小模型,以速度为使命,效果为主导。
  • 使用
    • 如果仓库下已有模型满足要求 → RapidOCR部署使用即可。
    • 不满足要求 → 基于PaddleOCR在自己数据上微调 → RapidOCR部署。
  • 如果该仓库有帮助到你,还请点个小星星呗!

文档导航

近期更新(more)

🎉2023-01-21 update:

  • [python] 添加含有文字的图像方向分类模块,具体参见Rapid Orientation

⚽2022-12-19 update:

  • [python] 添加表格结构还原模块,具体参见Rapid Table

🤖2022-12-14 update:

  • [python] 将配置参数和模型移到模块里面,同时将模型打到whl包内,可以直接pip安装使用,更加方便快捷。
  • 详情参见:README
  • 优化ocrweb部分代码,统一ocrweb中rapidocr_onnxruntime包与python目录下的rapidocr_onnxruntime为一个

生态框架

flowchart LR
    subgraph Step
    direction TB
    C(Text Det) --> D(Text Cls) --> E(Text Rec)
    end

    A[/OurSelf Dataset/] --> B(PaddleOCR) --Train--> Step --Convert--> F(ONNX)
    F --> G{RapidOCR Deploy\n<b>Python/C++/Java/C#</b>}
    G --> H(Windows x86/x64) & I(Linux) & J(Android) & K(Web) & L(Raspberry Pi)

    click B "https://github.com/PaddlePaddle/PaddleOCR" _blank

在线demo

  • 自建在线demo
    • 说明: 本在线demo不存储小伙伴们上传测试的任何图像数据,详情参见:ocrweb/README
    • demo所用模型组合(最优组合)为:
    ch_PP-OCRv3_det + ch_ppocr_mobile_v2.0_cls + ch_PP-OCRv3_rec
    
    • 运行机器配置: 4核 AMD EPYC 7K62 48-Core Processor
    • 示例图:
  • Hugging Face Demo
    • 该demo依托于Hugging Face的Spaces构建,采用Gradio库生成,同时添加三个超参数:
      • box_thresh: 检测到的框是文本的概率,值越大,框中是文本的概率就越大
      • unclip_ratio: 控制检测到文本框的大小,值越大,检测框整体越大
      • text_score: 文本识别结果是正确的置信度,值越大,显示出的识别结果更准确
    • 示例图:

TODO

  • iOS范例: 等待有缘人贡献代码
  • 依据python版本重写C++推理代码,以提升推理效果,并增加对gif/tga/webp 格式图片的支持

原始发起者及初创作者

致谢

  • 非常感谢DeliciaLaniD修复ocrweb中扫描动画起始位置错位问题。
  • 非常感谢zhsunlight关于参数化调用GPU推理的建议以及细致周到的测试。
  • 非常感谢lzh111222334修复python版本下rec前处理部分bug。
  • 非常感谢AutumnSun1996#42中的建议。

赞助

赞助者 应用的产品
-
  • 如果您想要赞助该项目,可直接点击当前页最上面的Sponsor按钮,请写好备注(您的Github账号名称),方便添加到上面赞助列表中。

版权声明

  • 如果你的产品使用了本仓库中的全部或部分代码、文字或材料
  • 请注明出处并包括我们的github url: https://github.com/RapidAI/RapidOCR

授权

  • OCR模型版权归百度所有,其它工程代码版权归本仓库所有者所有。
  • 本软件采用Apache 授权方式,欢迎大家贡献代码,提交issue 甚至PR。

加入我们

  • 微信扫描以下二维码,关注RapidAI公众号,回复OCR即可加入RapidOCR微信交流群:

  • 可以通过QQ群加入我们:887298230,或者用QQ扫描以下二维码:

示例图

C++/JVM示例图像

.Net示例图像

多语言示例图像

rapidocr's People

Contributors

swhl avatar znsoftm avatar benjaminwan avatar myq-c avatar dogevenci avatar autumnsun1996 avatar rensir avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.