Исправление кодировки русскоязычных статей, например из журнала Успехи физических наук (с 1995 года):
- исправление кодировки названия и авторов (metadata),
- исправление кодировки содержания,
- исправление кодировки текста при копировании и поиске.
Использование:
python decode_ufn.py input.pdf output.pdf
Для работы скрипта необходима библиотека PyMuPDF
.