GithubHelp home page GithubHelp logo

cesarcalafrioli / conversor-pdf Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 28 KB

Ferramenta de conversão de arquivos pdf para o formato txt utilizando a ferramenta xpdf.

License: MIT License

Python 100.00%
python python3 xpdf xpdf-reader

conversor-pdf's Introduction

CONVERSOR DE PDF

made-with-python

License License License License License

Índice

Descrição do Projeto

PDF Converter é um aplicativo web criado para facilitar a conversão de um arquivo PDF para o formato TXT e, em seguida, gerar a opção de download. O aplicativo utiliza a ferramenta xpdf, um projeto opensource que inclui, além do visualizador pdf, um conjunto de ferramendas usadas via prompt de comando voltadas para manipulação de arquivos pdf.

Mais informações sobre o xpdf acesse o site http://www.xpdfreader.com

Como funciona

O aplicativo recebe o arquivo PDF enviado pelo usuário. Após este clicar no botão de converter,o arquivo enviado é colocado temporariamente em uma subpasta chamada pdf localizada na pasta files e, em seguida, realiza a sua conversão para o formato txt. O arquivo convertido é colocado na subpasta txt, que também fica na pasta files, enquanto o arquivo PDF é apagado.

Instruções

  1. Instale as ferramentas de linha de comando xpdf conforme o seu sistema operacional.

    Instalando no linux

    wget --no-check-certificate https://dl.xpdfreader.com/xpdf-tools-linux-4.04.tar.gz
    tar -xvf xpdf-tools-linux-4.04.tar.gz && sudo cp xpdf-tools-linux-4.04/bin64/pdftotext /usr/local/bin
    

    Instalando no windows

    1 - Execute os comandos abaixo no powershell

    Invoke-WebRequest https://dl.xpdfreader.com/xpdf-tools-win-4.04.zip -OutFile $env:userprofile\Downloads\xpdf-tools-win-4.04.zip
    Expand-Archive -Path $env:userprofile\Downloads\xpdf-tools-win-4.04.zip -DestinationPath C:\
    

    2 - Em Painel de controle > Sistemas > Configurações avançadas do sistemas > Variáveis de ambiente, adicione na variável Path o diretório C:\xpdf-tools-win-4.04 \bin64, e clique em Ok.

  2. É necessário rodar esse aplicativo em um ambiente virtual python. Veja este tutorial para saber como.

  3. Instale os pacotes listados acima.

pip install -r requirements.txt
  1. Rode o streamlit
streamlit run app.py

O script irá abrir a ferramenta no navegador web.

Tecnologias utilizadas

  • python versão 3
  • xpdf ( É necessário instalar o xpdf separadamente, bem como configurar o ambiente de execução para que o aplicativo execute o comando da ferrammenta ).
  • streamlit

Licença

Licença MIT - César Augusto de Carvalho Calafrioli Móes

conversor-pdf's People

Contributors

cesarcalafrioli avatar

Watchers

 avatar

conversor-pdf's Issues

Ler o arquivo pdf

Inserir uma função de ler o arquivo pdf e também uma função drag and drop do streamlit.

Arquivo Requirements.txt

Adicionar um arquivo de texto chamado requirements, que por sua vez contém a lista pacotes necessários para a execução do script.

Arquivo README

Atualizar o arquivo README até a finalização do projeto.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.