GithubHelp home page GithubHelp logo

hercozauzau / imdb__webscraping Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 8 KB

Programa para extrair dados de filmes do IMDb e armazenar em Excel.

License: MIT License

Python 100.00%
beautyfulsoup exel imdb imdb-webscrapping pandas python-web-scraping webscraping

imdb__webscraping's Introduction

Leia em outros idiomas: English

IMDb Top 100 Filmes - Web Scraping

Este é um programa Python que realiza web scraping no site IMDb para obter os 100 filmes com as maiores pontuações de todos os tempos. Ele extrai informações como posição, título, pontuação, ano e diretor de cada filme e armazena esses dados em um arquivo Excel.

Pré-requisitos

Certifique-se de ter o Python instalado em seu sistema. Além disso, você precisará instalar as seguintes bibliotecas Python:

  • requests
  • beautifulsoup4
  • pandas
  • openpyxl

Você pode instalar essas bibliotecas executando o seguinte comando no terminal:

pip install requests beautifulsoup4 pandas openpyxl

Como usar

  1. Clone este repositório ou faça o download do arquivo imdb_scraping.py.
  2. Abra um terminal e navegue até o diretório em que o arquivo imdb_scraping.py está localizado.
  3. Execute o seguinte comando para executar o programa:
python imdb_scraping.py
  1. Aguarde até que o programa seja executado. Ele coletará os dados dos 100 filmes do IMDb com as maiores pontuações e salvará em um arquivo chamado top_100_filmes_imdb.xlsx.

Resultados

O programa irá gerar um arquivo Excel com os seguintes campos para cada filme:

  • Id: a posição do filme no ranking.
  • Title: o título do filme.
  • Rating: a pontuação do filme no IMDb.
  • Year: o ano do filme.
  • Director: o diretor do filme.

Notas

  • Este programa realiza web scraping no site IMDb (https://www.imdb.com). Verifique a política de uso do site antes de utilizá-lo.
  • Este programa foi desenvolvido apenas para fins educacionais e de aprendizado. Use-o de forma responsável e respeite os termos de uso dos sites que você está coletando dados.

imdb__webscraping's People

Contributors

hercozauzau avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.