Light

turnerrussell50 / rapidocr Goto Github PK

View Code? Open in Web Editor NEW

This project forked from rapidai/rapidocr

0.0 0.0 0.0 18.04 MB

A cross platform OCR Library based on PaddleOCR & OnnxRuntime & OpenVINO.

License: Apache License 2.0

Shell 0.93% C++ 54.69% Python 23.70% C 0.64% Java 0.65% C# 5.53% Kotlin 9.29% CSS 0.48% HTML 1.86% CMake 0.67% Batchfile 0.95% Jupyter Notebook 0.60%

rapidocr's Introduction

RapidOCR (捷智OCR- 信创级开源OCR - 为世界内容安全贡献力量)

简体中文 | English

目录

RapidOCR (捷智OCR- 信创级开源OCR - 为世界内容安全贡献力量)

商业支持

提供信创平台多架构，包括Arm/X86/mips(龙芯)/RISC-V等信创CPU支持，同时兼容ONNXRuntime/OpenVINO/NCNN。
有意者邮件联系: [email protected], 请先邮件咨询服务项目，即时回复联系方式。

简介

💖目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。
中文广告：欢迎加入我们的QQ群下载模型及测试程序，QQ群号：887298230
缘起：百度paddlepaddle工程化不是太好，为了方便大家在各种端上进行ocr推理，我们将它转换为onnx格式，使用Python/C++/Java/Swift/C# 将它移植到各个平台。
名称来源：轻快好省并智能。基于深度学习技术的OCR技术，主打人工智能优势及小模型，以速度为使命，效果为主导。
使用：
- 如果仓库下已有模型满足要求 → RapidOCR部署使用即可。
- 不满足要求 → 基于PaddleOCR在自己数据上微调 → RapidOCR部署。
如果该仓库有帮助到你，还请点个小星星呗！

文档导航

Python范例
- rapidocr_openvino
C++范例(Windows/Linux/macOS)
- RapidOcrOnnx
- RapidOcrNcnn
Jvm范例(Java/Kotlin)
- RapidOcrOnnxJvm
- RapidOcrNcnnJvm
.Net范例(C#)
Android范例
网页版范例
- 网页版OCR
- 多语言网页版OCR
版面结构化
衍生项目
- RapidOCR HTTP服务/win32程序/易语言编写
垂直项目
- RapidVideOCR：基于RapidOCR，提取视频中的硬字幕
- LGPMA_Infer: 表格结构还原 | 博客解读论文和源码
- 文档图像矫正-PaperEdge | Demo
- 图像文字擦除-CTRNet | Demo
模型相关
- 模型转换
- 模型下载及效果对比
常见问题 FAQ

近期更新(more)

🎉2023-01-21 update:

[python] 添加含有文字的图像方向分类模块，具体参见Rapid Orientation

⚽2022-12-19 update:

[python] 添加表格结构还原模块，具体参见Rapid Table

🤖2022-12-14 update:

[python] 将配置参数和模型移到模块里面，同时将模型打到whl包内，可以直接pip安装使用，更加方便快捷。
详情参见：README
优化ocrweb部分代码，统一ocrweb中rapidocr_onnxruntime包与python目录下的rapidocr_onnxruntime为一个

生态框架

flowchart LR
    subgraph Step
    direction TB
    C(Text Det) --> D(Text Cls) --> E(Text Rec)
    end

    A[/OurSelf Dataset/] --> B(PaddleOCR) --Train--> Step --Convert--> F(ONNX)
    F --> G{RapidOCR Deploy\n<b>Python/C++/Java/C#</b>}
    G --> H(Windows x86/x64) & I(Linux) & J(Android) & K(Web) & L(Raspberry Pi)

    click B "https://github.com/PaddlePaddle/PaddleOCR" _blank

在线demo

自建在线demo
- 说明: 本在线demo不存储小伙伴们上传测试的任何图像数据，详情参见：ocrweb/README
- demo所用模型组合（最优组合）为:
```
ch_PP-OCRv3_det + ch_ppocr_mobile_v2.0_cls + ch_PP-OCRv3_rec
```
- 运行机器配置: 4核 AMD EPYC 7K62 48-Core Processor
- 示例图:
Hugging Face Demo
- 该demo依托于Hugging Face的Spaces构建，采用Gradio库生成，同时添加三个超参数:
  - box_thresh: 检测到的框是文本的概率，值越大，框中是文本的概率就越大
  - unclip_ratio: 控制检测到文本框的大小，值越大，检测框整体越大
  - text_score: 文本识别结果是正确的置信度，值越大，显示出的识别结果更准确
- 示例图：

TODO

iOS范例: 等待有缘人贡献代码
依据python版本重写C++推理代码，以提升推理效果，并增加对gif/tga/webp 格式图片的支持

原始发起者及初创作者

致谢

非常感谢DeliciaLaniD修复ocrweb中扫描动画起始位置错位问题。
非常感谢zhsunlight关于参数化调用GPU推理的建议以及细致周到的测试。
非常感谢lzh111222334修复python版本下rec前处理部分bug。
非常感谢AutumnSun1996在#42中的建议。

赞助

赞助者	应用的产品

	-

如果您想要赞助该项目，可直接点击当前页最上面的Sponsor按钮，请写好备注(您的Github账号名称)，方便添加到上面赞助列表中。

版权声明

如果你的产品使用了本仓库中的全部或部分代码、文字或材料
请注明出处并包括我们的github url: https://github.com/RapidAI/RapidOCR

授权

OCR模型版权归百度所有，其它工程代码版权归本仓库所有者所有。
本软件采用Apache 授权方式，欢迎大家贡献代码，提交issue 甚至PR。

加入我们

微信扫描以下二维码，关注RapidAI公众号，回复OCR即可加入RapidOCR微信交流群：
可以通过QQ群加入我们：887298230，或者用QQ扫描以下二维码:

示例图

C++/JVM示例图像

.Net示例图像

多语言示例图像

rapidocr's People

Contributors

Recommend Projects

React

A declarative, efficient, and flexible JavaScript library for building user interfaces.
Vue.js

🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
Typescript

TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
TensorFlow

An Open Source Machine Learning Framework for Everyone
Django

The Web framework for perfectionists with deadlines.
Laravel

A PHP framework for web artisans
D3

Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

javascript

JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
web

Some thing interesting about web. New door for the world.
server

A server is a program made to process requests and deliver data to clients.
Machine learning

Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Visualization

Some thing interesting about visualization, use data art
Game

Some thing interesting about game, make everyone happy.

Recommend Org

Facebook

We are working to build community through open source technology. NB: members must have two-factor auth.
Microsoft

Open source projects and samples from Microsoft.
Google

Google ❤️ Open Source for everyone.
Alibaba

Alibaba Open Source for everyone
D3

Data-Driven Documents codes.
Tencent

China tencent open source team.

Jobs