GithubHelp home page GithubHelp logo

wangfreexx / wangfreexx-tianruoocr-cl-paddle Goto Github PK

View Code? Open in Web Editor NEW
1.3K 1.3K 131.0 8.45 MB

天若ocr开源版本的本地版,采用Chinese-lite和paddleocr识别框架

License: GNU General Public License v3.0

C# 99.71% Python 0.29%

wangfreexx-tianruoocr-cl-paddle's People

Contributors

wangfreexx avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

wangfreexx-tianruoocr-cl-paddle's Issues

一点小建议,作者大大可以看下

作者你好,众所周知OCR接口容易失效是一大痛点,所以增加自定义OCR接口很重要,相信很多人也有这样的需求。

功能需求:
由用户自定义OCR接口,程序读取用户填写的配置信息:

OCR API URL :http://example.com
Data: {
.....
}

程序将截图转base64添加到Data,然后Post请求OCR URL,再由自定义OCR接口返回识别参数(返回的参数格式由你决定,用户根据你的参数格式做接口修改)

请作者大大可以采纳我的建议,我代表大家感谢你的付出!

win7运行报错

捕获到未处理异常:System.IO.IOException
异常信息:请求的操作无法在使用用户映射区域打开的文件上执行
异常堆栈: at System.IO. Error.WinIOError(Int32 errorCode, StringmaybeFullPath)
at System.IO.FileStream.Init(String path, FileMode mode, FileAccessaccess, Int32 rights, Boolean useRights, FileShare share Int32 bufferSizeFileOptions options, SECURITY_ATTRIBUTES secAttrs, String msgPath,
Boolean bFromProxy, Boolean useLongPath, Boolean checkHost)at System.IO.FileStream..ctor(String path, FileMode mode, FileAccessaccess, FileShare share)
at System.Xml.XmlDocument.Save(String filename)
at TrOCRHelper.IniHelper.SetValue(String sectionName, String key.String value)
at TrOCR.Program.DealErrorConfig()
at TrOCRProgram.Main(String! args)

请问这什么情况?
微信图片_20240115183717

一切都很好,只有一个英文识别问题!

无论是CL还是Pa接口,英文识别都有毛病;首先CL无法识别全部英文,其次Pa接口选择英文数字模式后,可以识别出全部英文,但是无法自动识别英文单词之间的空格,导致长达几行的英文段落中的所有单词都连在了一起→既没法阅读也没法翻译

打包的文件名问题

希望作者每次更新文件名能保持命名规律,方便添加到 scoop 中自动更新

不能设置代理么?

印象中原来有设置代理的功能啊,是移除了么

不能设置代理,Google 翻译不能用了,得申请国内的接口
image

作者考虑做一下这个功能么?

[识别问题] 竖排识别极低的问题

环境条件

  • Win10 20H2, wangfreexx-tianruoocr-cl-paddle V1.3.0
  • 程序正常运行
  • PA-OCR 日语 识别配置
    Snipaste_2021-12-29_21-13-00

问题描述(参考截图)

  • 在未处理的情况下,图片对识别结果自动转成了简体字,直接影响整体翻译了
  • 相同的内容,横向能识别,竖排成功率低到可以忽略这个功能

截图

  • 自动转换字体,测试示例与结果
    Snipaste_2021-12-29_21-17-05Snipaste_2021-12-29_21-17-51
  • 横竖排识别对比,以下基于同一张图测试
    Snipaste_2021-12-29_21-24-29
    • 横排测试
      Snipaste_2021-12-29_21-26-59
    • 竖排测试
      Snipaste_2021-12-29_21-29-57
      Snipaste_2021-12-29_21-30-32

設置窗口顯示不完

設置的窗口不靈活,導致一些設定功能不顯示。比如:Tab1‘常規’的自動保存被蓋了一半。

如何更新模型

image
这些文件,如何更新呀?我看paddle-ocr出了v3版本了,想更新一下

English interface

I don't know Chinese so I don't how to change to English interface

关于翻译接口错误的问题

目前有两个问题想请教一下
1、谷歌翻译的接口是否有上限之类的,用了一段时间后(大概翻译了几十次和一千多字符左右)就直接报错了
[谷歌接口报错]:
1.网络错误或者文本过长。
2.谷歌接口可能对于某些网络不能用,具体不清楚。可以尝试挂VPN试试。
3.这个问题我没办法修复

2、输入百度翻译的api后无法使用百度翻译,正常谷歌翻译可用的情况下也是,排除了网络和api问题,想问问是不是没有用百度的通用翻译API HTTPS 地址:https://fanyi-api.baidu.com/api/trans/vip/translate
image
报错:翻译超时,请检查网络,或更换翻译平台。

如何设置默认字体

作者您好,
微软雅黑这个字号很小而且很粗,字很挤看着太累了,不如宋体看着顺眼,现在是只能识别后再修改成宋体,而且下次识别的结果还是微软雅黑的,很麻烦。请问怎么能把默认字体设置成宋体。

期待回复。谢谢

onnxruntime on win7

你好,我已经用你事先编译好的onnxruntime.dll替换原本ML.onnxruntime里的dll,发现还是还没使用。是我哪里步骤有问题吗,是不是少了一个win7版本的Microsoft.ML.OnnxRuntime.dll

大佬, 能问下天若ocr的接口问题吗, 官方这个接口啥意思呀

大佬, 能问下天若ocr的接口问题吗, 官方这个接口啥意思呀 //image:要识别的图片
public static string OCR_Custom(Image image)
{
//string url = "";
//string poststr ="";
//string result =CustomHelp.HttpPost(url,poststr);
//获取请求获取解析结果后按照下面格式进行解析
TxtFormat.Root jsonRoot=new TxtFormat.Root();
jsonRoot.result=new List<TxtFormat.TextBlock>();
jsonRoot.isHasLocation=true;//判断是否含有坐标返回
for(int i=0; i<5; i++)//遍历返回的json字符串
{
TxtFormat.TextBlock textBlock = new TxtFormat.TextBlock();
textBlock.Text = "公式测试文本"+i.ToString();//json内的文本
textBlock.TopLeft = new Point(0,0);//左上角坐标
textBlock.TopRight = new Point(0,0);//右上角坐标
textBlock.BottomRight =new Point(0,0);//右下角坐标
textBlock.BottomLeft =new Point(0,0);//左下角坐标
jsonRoot.result.Add(textBlock);
}
string json = JsonConvert.SerializeObject(jsonRoot);
return json;
}

识别英文时无空格

开发大大您好!感谢您本地OCR版本的开发!

我遇到了英文无空格的问题,请问应该如何解决?

image

识别弹窗中字体格式问题

识别弹窗中若输入数字必然是不常用的全角,很不方便,希望能调整一下。
另外,识别内容的合并功能希望能再优化一下,最好能去掉所有格式,这样更便于使用。

PaddleOCR社区常规赛邀请您的参加

开发者您好,

诚邀您参加PaddleOCR社区常规赛。社区常规赛意在扩大基于PaddleOCR开发的各种项目的影响力,通过常规赛形式对优质的社区项目进行奖励。并且所有报名项目都会收录在社区贡献文档中,通过PaddleOCR平台流量让优质的项目获得更多关注。

如果您有意参加,请在1月12日前在上述链接中报名并提交本项目。谢谢!

PaddleOCR-PM

希望提供命令行静默操作

你好,
希望提供命令行静默操作。这样的话方便使用其他软件后台调用它。
平时使用ShareX多一些,希望可以添加命令好调用天若OCR,现在只能打开软件,还需要再次按F4。。

还有一个功能需求,,希望可以用其他颜色标注出准确率低的字,,,

非常感谢!
祝好

可以加入公式接口吗?

天若OCR原版有公式接口,对于理工科来说很有用途,这里的版本能加上这个接口设置吗?

无法朗读

系统是win11最新版本,可以正常识别文字正常翻译但就是无法朗读/(ㄒoㄒ)/~~真的很需要朗读功能

静默识别不太好吧。

本想反映置顶无效,结果发现是静默识别默认开启的问题,很多时候也不能保证识别百分百正确,还是需要在显示界面编辑一下,还有识别英文看翻译。

快捷键组合键无法使用

win11系统1381版本,快捷键的组合键不可用,修改为ctrl+alt+其他不可生效,只能F1234等等或者单个的按键例如a\b\c这种单个的按键,组合键无法保存

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.