GithubHelp home page GithubHelp logo

luisfelipesdn12 / trabalhos-escolares-automaticos Goto Github PK

View Code? Open in Web Editor NEW
2.0 2.0 0.0 89 KB

Um programa que, a partir de um assunto, extrai conteúdo da Wikipedia, resume e adiciona imagens, depois formata e exporta um documento em forma de trabalho escolar.

License: MIT License

Python 80.66% Batchfile 0.36% HTML 18.97%

trabalhos-escolares-automaticos's Introduction

trabalhos-escolares-automaticos

Um programa que, a partir de um tema, extrai conteúdo da Wikipedia, resume e adiciona imagens; depois formata e exporta um documento em formato de trabalho escolar.


Ideia:

Digitar um tema e esperar. Depois de um tempo, ter em mãos um arquivo formatado com imagens e conteúdo resumido da Wikipedia. A ideia não é necessariamente ter o resultado final, mas ter algo próximo disso: algo que precisemos apenas fazer algumas alterações pequenas.

Uso:

  1. Tenha Python instalado;
  2. Clone ou baixe o repositório;
  3. Vá na pasta requirements e clique em install_all.bat; isso vai instalar todos os pacotes e bibliotecas necessárias e instalar o plugin punkt do módulo nltk.
  4. Execute o arquivo main.py e digite o termo de pesquisa, e o percentual de resumo.
  5. Vá para a pasta pesquisa criada automaticamente na pasta onde o script foi executado; leia e faça aperfeiçoamentos, se necessário na sua pesquisa automática :)

Algum problema ou sugestão? Abra uma issue!

Funcionamento:

Nota: em aperfeiçoamento.

  • O programa recolhe o input do usuário, contendo o tema da pesquisa;

  • A partir desse input, faz a pesquisa automática na Wikipedia;

    Usei a biblioteca wikipedia para extrair o conteúdo.

  • Com o conteúdo dessa pesquisa, limpa espaços e conteúdos indesejados;

  • Com o conteúdo limpo, resume o texto;

    Utilizei, como base, uma gist de sumarização do GitHub, clique aqui para ver.

  • Separa o conteúdo em parágrafos e define palavras chave para cada;

    Para isso, usei um algoritmo de Compreensão de Linguagem Natural por inteligência artificial do IBM Cloud/ Watson, clique aqui para ver.

  • Faz o download de imagens com base em palavras-chave extraídas do resumo;

    Usei a API do Google Cloud Platform chamada Custom Search, clique aqui para ver.

  • Com todas as informações, formata um arquivo de texto com as imagens e o conteúdo;

  • Gera e exporta o documento final.

trabalhos-escolares-automaticos's People

Contributors

luisfelipesdn12 avatar

Stargazers

 avatar Giovanna Alves avatar

Watchers

James Cloos avatar  avatar

trabalhos-escolares-automaticos's Issues

Passos

  • Definir passos.
    • Definir passos do input.
    • Definir passos da pesquisa automática.
    • Definir passos do resumidor.
    • Definir passos do download de imagens.
    • Definir passos do formatador.
    • Definir passos do gerador de arquivos.

  • Passos do input:
    • Pegar o termo de pesquisa.
    • Pegar o prefixo.
    • Guardar num dicionário.

  • Passos da pesquisa automática::
    • Estudar sobre API's para web scrapping da Wikipedia.
    • Escolher a API.
    • A partir do termo de pesquisa, extrair o conteúdo da Wikipedia.

  • Passos do resumidor:
    • Estudar sobra API's para resumir textos.
    • Escolher a API.
    • A partir do conteúdo a Wikipedia, fazer o resumo.

  • Passos do dowload de imagens:
    • Estudar sobre API's para download de imagens do Google Images.
    • Escolher a API.
    • A partir do resumo, fazer o download de imagens.

Aprimoramentos

  • Resolver problema de imagens iguais
    • Criar uma lista em que são armazenadas imagens já usadas.
    • Para cada adição, testar na lista se são iguais; se sim: vai para a próxima imagem.

  • Melhorias no código
    • Criar variáveis globais no início do código para armazenar configurações como nota de corte para adição de imagens.

  • Criar GUI
    • Estudar sobre GUI.
    • Definir uma para usar.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.