Classificação de sentimentos usando Keras e redes neurais recorrentes LSTM
Este é o código que foi apresentado durante o vídeo: https://youtu.be/bIcadBu--u8
Você vai precisar dos seguintes pacotes instalados:
- tensorflow >= 1.8.0
- keras >= 2.1.5
- matplotlib >= 2.2.2
- nltk >= 3.2.5
- tqdm >= 4.23.3
- scikit-learn >= 0.19.0
- pandas >= 0.22.0
- xlrd >= 1.1.0
Eu já preparei o dataset e o disponibilizei formatado em uma planilha excel. Você pode baixá-lo neste link: https://1drv.ms/u/s!AtlcQ2oZw-Fri_lQozAJALF6uKjgVQ. Depois de baixar o arquivo, coloque-o na pasta dataset/. Porém, caso você prefera baixar no formato original, segue o link:
IMDB dataset: http://www.cs.cornell.edu/people/pabo/movie-review-data/review_polarity.tar.gz
GloVe: Global Vectors for Word Representation: https://nlp.stanford.edu/projects/glove/ Glove Word Representations (pre-trained word vectors): http://nlp.stanford.edu/data/glove.6B.zip
Depois de baixar os word embeddings pré-treinados, mova os arquivos descompactados para dentro da pasta word_embedding/.