天若ocr开源版本的本地版，采用Chinese-lite和paddleocr识别框架

License: GNU General Public License v3.0

C# 99.71% Python 0.29%

wangfreexx-tianruoocr-cl-paddle's People

Contributors

Stargazers

Watchers

Forkers

cmarky pengshistc passerbyzh l342723951 astronmyphy bubdm crackercat datetome ryanfu lantenggit yokey0721 wochitudou 183demao mystery4f virgilwa vpsbash ascte jeff-cn langren1353 kengziji blakeshake 0000duck laafeng tyronebj eight-nines cnganjie lqmeter edimax82 bruce-zhangs wangwh27 sijiyinse becksun gukey petercao wodemax ccnano liuyuqingenglish jorbin clift190 whx189855 kuaizi lwd-temp caibao413672274 iiaini elitever lwq202 yr1044 bluewindd zhuofalin yxcqr yiyinyiyang dn-nateriver qiweiv zzj-pcl jorray 976339067 fjxhkj gitzifeng gg-big-org bachelor-button s627995568 ynjw tangkof zack-sys milu223 wrnxr233 fc4lee daotaoism antiviruskit linnetfire mqt635 wesley1224 lpker1 xxoolm mingithub561 tonyleecn awesomeyuer hubyuen mykofzone goucey flyhong666 huiduer t0903 xianglong6 annalinlin teesp younker1996 ko9ma7 cloudplains dongzhang1937 e024 lat0ur caoshuaing ashurajo tang1007 geffzhang yahuiwong ludun noone99999 kkeenee

wangfreexx-tianruoocr-cl-paddle's Issues

一点小建议，作者大大可以看下

作者你好，众所周知OCR接口容易失效是一大痛点，所以增加自定义OCR接口很重要，相信很多人也有这样的需求。

功能需求：
由用户自定义OCR接口，程序读取用户填写的配置信息：

OCR API URL ：http://example.com
Data: {
.....
}

程序将截图转base64添加到Data，然后Post请求OCR URL，再由自定义OCR接口返回识别参数（返回的参数格式由你决定，用户根据你的参数格式做接口修改）

请作者大大可以采纳我的建议，我代表大家感谢你的付出！

PA-OCR 英文数字模型下识别的英文单词间缺少空格

PA-OCR 英文数字模型下识别的英文单词比中文模型下的识别准确率高很多。
美中不足的是识别的英文单词之间却会缺少空格。

捕获到未处理异常:System.IO.IOException
异常信息:请求的操作无法在使用用户映射区域打开的文件上执行
异常堆栈: at System.IO. Error.WinIOError(Int32 errorCode, StringmaybeFullPath)
at System.IO.FileStream.Init(String path, FileMode mode, FileAccessaccess, Int32 rights, Boolean useRights, FileShare share Int32 bufferSizeFileOptions options, SECURITY_ATTRIBUTES secAttrs, String msgPath,
Boolean bFromProxy, Boolean useLongPath, Boolean checkHost)at System.IO.FileStream..ctor(String path, FileMode mode, FileAccessaccess, FileShare share)
at System.Xml.XmlDocument.Save(String filename)
at TrOCRHelper.IniHelper.SetValue(String sectionName, String key.String value)
at TrOCR.Program.DealErrorConfig()
at TrOCRProgram.Main(String! args)

请问这什么情况？

一切都很好,只有一个英文识别问题!

无论是CL还是Pa接口,英文识别都有毛病;首先CL无法识别全部英文,其次Pa接口选择英文数字模式后,可以识别出全部英文,但是无法自动识别英文单词之间的空格,导致长达几行的英文段落中的所有单词都连在了一起→既没法阅读也没法翻译

能否修复支持一下二维码先验，二维码失败后再走原始流程

试了一下主要的功能都挺好的，除了二维码这块的体验上有些不如人意。
于是想问问能否增加一下先校验内容是否二维码，是则直接输出了（至少https这种的能直接输出），否则的话进行正常ocr识别

打包的文件名问题

希望作者每次更新文件名能保持命名规律，方便添加到 scoop 中自动更新

不能设置代理么？

印象中原来有设置代理的功能啊，是移除了么

不能设置代理，Google 翻译不能用了，得申请国内的接口

作者考虑做一下这个功能么？

[识别问题] 竖排识别极低的问题

环境条件

Win10 20H2, wangfreexx-tianruoocr-cl-paddle V1.3.0
程序正常运行
PA-OCR 日语识别配置

问题描述(参考截图)

在未处理的情况下，图片对识别结果自动转成了简体字，直接影响整体翻译了
相同的内容，横向能识别，竖排成功率低到可以忽略这个功能

截图

自动转换字体，测试示例与结果
横竖排识别对比，以下基于同一张图测试
- 横排测试
- 竖排测试

設置窗口顯示不完

設置的窗口不靈活，導致一些設定功能不顯示。比如：Tab1‘常規’的自動保存被蓋了一半。

有人在pdd卖你做的软件卖的很多了

拆分，朗读等功能别删呀，求修复一下。

拆分、合并、分段都是不错的功能，朗读也可以来朗读英文。

点击拆分键文字消除

如何更新模型

这些文件，如何更新呀？我看paddle-ocr出了v3版本了，想更新一下

English interface

I don't know Chinese so I don't how to change to English interface

关于翻译接口错误的问题

目前有两个问题想请教一下
1、谷歌翻译的接口是否有上限之类的，用了一段时间后（大概翻译了几十次和一千多字符左右）就直接报错了
[谷歌接口报错]：
1.网络错误或者文本过长。
2.谷歌接口可能对于某些网络不能用，具体不清楚。可以尝试挂VPN试试。
3.这个问题我没办法修复

2、输入百度翻译的api后无法使用百度翻译，正常谷歌翻译可用的情况下也是，排除了网络和api问题，想问问是不是没有用百度的通用翻译API HTTPS 地址：https://fanyi-api.baidu.com/api/trans/vip/translate

报错：翻译超时，请检查网络，或更换翻译平台。

求32位的

公司内网电脑32位的

如何设置默认字体

作者您好，
微软雅黑这个字号很小而且很粗，字很挤看着太累了，不如宋体看着顺眼，现在是只能识别后再修改成宋体，而且下次识别的结果还是微软雅黑的，很麻烦。请问怎么能把默认字体设置成宋体。

期待回复。谢谢

onnxruntime on win7

你好，我已经用你事先编译好的onnxruntime.dll替换原本ML.onnxruntime里的dll，发现还是还没使用。是我哪里步骤有问题吗，是不是少了一个win7版本的Microsoft.ML.OnnxRuntime.dll

很实用，希望增加批量图片识别和表格识别

希望增加批量图片识别和表格识别，在工作中经常能用到

请问怎么取消首行缩进啊？

每次取消后再次启动，还是会变成首行缩进模式。

程序初始化失败

点击程序，提示这个问题。

关于谷歌翻译的建议

建议谷歌翻译直接更改为代理的接口

大佬, 能问下天若ocr的接口问题吗, 官方这个接口啥意思呀

大佬, 能问下天若ocr的接口问题吗, 官方这个接口啥意思呀 //image：要识别的图片
public static string OCR_Custom(Image image)
{
//string url = "";
//string poststr ="";
//string result =CustomHelp.HttpPost(url,poststr);
//获取请求获取解析结果后按照下面格式进行解析
TxtFormat.Root jsonRoot=new TxtFormat.Root();
jsonRoot.result=new List<TxtFormat.TextBlock>();
jsonRoot.isHasLocation=true;//判断是否含有坐标返回
for(int i=0; i<5; i++)//遍历返回的json字符串
{
TxtFormat.TextBlock textBlock = new TxtFormat.TextBlock();
textBlock.Text = "公式测试文本"+i.ToString();//json内的文本
textBlock.TopLeft = new Point(0,0);//左上角坐标
textBlock.TopRight = new Point(0,0);//右上角坐标
textBlock.BottomRight =new Point(0,0);//右下角坐标
textBlock.BottomLeft =new Point(0,0);//左下角坐标
jsonRoot.result.Add(textBlock);
}
string json = JsonConvert.SerializeObject(jsonRoot);
return json;
}

如果您有意参加，请在1月12日前在上述链接中报名并提交本项目。谢谢！

PaddleOCR-PM

非常感谢！
祝好

wangfreexx / wangfreexx-tianruoocr-cl-paddle Goto Github PK

wangfreexx-tianruoocr-cl-paddle's People

Contributors

Stargazers

Watchers

Forkers

wangfreexx-tianruoocr-cl-paddle's Issues

环境条件

问题描述(参考截图)

截图

Recommend Projects

Recommend Topics

Recommend Org

Jobs