Google Cloud Vision API を使ってPDFのOCRを書き換えるスクリプトです。
- Google Cloud Platform でプロジェクトを作成し、APIを有効にする
- Google Cloud Vision API service account key fileをダウンロード
- cat example.env > .envで環境変数ファイルを作成し必要な情報を記入。
- ダウンロードしたkey fileのパスをGOOGLE_APPLICATION_CREDENTIALSに設定。
- 元のPDFファイルのパスをINPUT_FILEに設定
- OCRを書き換えたPDFファイルを保存するパスをOUTPUT_FILEに設定
- pythonの仮想環境を作成し、必要なライブラリをインストール
- python -m venv venv
- source ./venv/bin/activate
- pip install -r requirements.txt
- 実行
- bash redo_ocr.sh