用keras实现ocr定位、识别,后端tensorflow.
- 环境 win10 titanx
-
crnn:vgg + blstm + blsmt + ctc 原版crnn 测试速度较慢 32X280 耗时 60ms ,放弃优化。 数据集是自己造的随机数据,且比较简单。如果要测试请去这里下载 https://github.com/senlinuc/caffe_ocr 语料数据集 而且caffe_ocr的crnn更快 9ms,不知道tf和caffe差在哪里?
-
densenet-ocr :densent + ctc 无lstm 是对caffe_cor的复现 https://github.com/senlinuc/caffe_ocr (包含数据集)
网格结构 | GPU | 准确率 | 模型大小 |
---|---|---|---|
crnn | 60ms | 97.2 | |
densent+ctc | 8ms | 0.982 | 18.9MB |
- CTPN:效果很好,且已有tensorflow实现https://github.com/eragonruan/text-detection-ctpn, 但是框架太重。下一步用keras实现或者用其他框架,目前还没确定