GithubHelp home page GithubHelp logo

alan-barzilay / nlportugues Goto Github PK

View Code? Open in Web Editor NEW
77.0 8.0 27.0 68.13 MB

NLPortuguês - Aprenda PLN em português! Esse repositório contem os materiais e exercícios do curso NLPortuguês, hospedado tambem no coursera sob o nome Processamento Neural de Linguagem Natural em Português I.

Jupyter Notebook 99.71% Python 0.29%
nlp portuguese educational

nlportugues's Introduction


Este repositório contém os materiais e exercícios do curso NLPortuguês, hospedado tambem no coursera sob o nome Processamento Neural de Linguagem Natural em Português I. Para consultar os slides utilizados nas aulas, eles estão disponíveis neste repositório e no site oficial do curso.

Instalação do ambiente

No coursera oferecemos links para notebooks do colab onde o aluno pode explorar os notebooks jupyter das listas semanais e os auto corretores para as diferentes entregas.

Caso o aluno deseje realizar as listas de maneira local, a maneira mais fácil é fazer um fork deste repositório e criar um novo venv com os mínimos requisitos em sua máquina.

  • Para criar um venv basta utilizar o comando python -m venv nome_do_venv na pasta desejada.
  • Então ative o venv com source nome_do_venv/bin/activate

Para instalar as bibliotecas necessárias basta utilizar o comando pip install -r requirements.txt, independente de estar usando um venv ou não.

Para poder utilizar seu venv como um kernel de Jupyter notebook, você precisará executar o comando ipython kernel install --user --name=nome_do_venv. Para mais detalhes, esse link pode ser útil.

Financiamento

Esse curso foi baseado na matéria MAC5725 - Linguística Computacional ministrada no Instituto de Matemática e Estatística da Universidade de São Paulo (IME-USP), o qual recebeu financiamento pelo prêmio Faculty Awards to Support Machine Learning Courses, Diversity, and Inclusion at Universities da empresa Google AI.


Acknowledgments and Funding

This course was based on the graduate course MAC5725 - Linguística Computacional ministered at the Institute of Mathematics and Statistics of the University of São Paulo (IME-USP) that received funding from the "Faculty Awards to Support Machine Learning Courses, Diversity, and Inclusion at Universities" from Google AI.

nlportugues's People

Contributors

alan-barzilay avatar voaneves avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

nlportugues's Issues

image lint report - consertar no site alguma hora

image


Image #2 & #3
Missing src attribute

Older browsers or other user agents which don’t understand the srcset attribute should get a fallback image.
The sizes attribute has to match the width of the image

The size of the image doesn’t match the sizes attribute (max-width: 740px) 280px, (max-width: 1200px) 35vw + 1rem, 436px. At a viewport of 1000x563 the image was 366 pixels wide instead of the specified 0 (Infinity% difference). The affected viewports are 760x428-1200x1600.

Try using sizes="(min-width: 1280px) 436px, (min-width: 800px) calc(30.43vw + 53px), 274px" instead.

The sizes attribute is a hint for browsers which should tell them how large the image will be displayed. If it doesn’t match the real size, browsers cannot select the correct image source.

<img
class="foto"
srcset="imgs/codigo-280.avif 280w, imgs/codigo-480.avif 480w"
sizes="(max-width: 740px) 280px, (max-width:1200px) 35vw + 1rem, 436px"
alt="Código python em um editor de texto"
loading="lazy"

Curso Processamento Neural de Linguagem Natural em Português I (Coursera)

Estou enfrentando um problema de verificação na entrega da semana 04 no curso "Processamento Neural de Linguagem Natural em Português I" no Coursera.

Os códigos sgd.py e word2vec.py geram resultados corretos quando executados localmente, no entanto, ao realizar a entrega, ocorre erro.

No fórum outros colegas também estão enfrentando o mesmo problema. Gostaria gentilmente que verificasse essa situação quando possível.

Agradeço pela atenção.

ModuleNotFoundError: No module named 'utils.gradcheck'

Hello,

I encountered an error today while trying to execute python run.py, in the EP1 folder:

Traceback (most recent call last):
  File "C:\Users\victo\OneDrive\Desktop\NLPortugues-master\NLPortugues-master\EP 1\run.py", line 11, in <module>
    from word2vec import *
  File "C:\Users\victo\OneDrive\Desktop\NLPortugues-master\NLPortugues-master\EP 1\word2vec.py", line 6, in <module>
    from utils.gradcheck import gradcheck_naive, grad_tests_softmax, grad_tests_negsamp
ModuleNotFoundError: No module named 'utils.gradcheck'

Is it safe to remove the import line for utils? The necessary functionalities from utils are already implemented throughout the file.

Thanks!

errata video Modulo 1 - Problemas I

Coursera eh horrivel entao vou registrar aqui essa errata para n esquecermos. Ja q ela exige editar o video e no momento estamos sem um editor de video, eh um pouco mais trabalhosa do q corrigir um typo.

Aos 0:48 do vídeo Problemas I, entendo que foi dito o número errado, mas de uma maneira que pode confundir bastante quem está aprendendo.
O contexto é distinguir as definições de "ocorrência de palavra" e "tipo de palavra". Foi dita a frase "Então, se eu tenho 'o menino viu o vizinho', eu tenho quatro ocorrências de palavras.", mas de fato são cinco ocorrências (tanto que mais à frente é mencionada a "quinta ocorrência"). O que são quatro são os tipos de palavra.
Sugiro fazer uma correção, já vi correções no Coursera em que a pessoa "dubla" a própria voz (para que se ouça "cinco" nessa frase nesse momento, não "quatro").

Instrucoes para re-submissao da entrega semana 4 (word2vec)

Esse curso tinha alguns problemas e inconsistencias com o coursera na sua versao original, caso vc esteja re-submetendo seu trabalho você apenas terá que fazer pequenas modificações muito simples e rápidas nos arquivos sgd.py e wordvec.py (remover a importacao de utils, adicionar a funcao main e substituir o string que eh impresso a cada 100 iteracoes no arquivo sgd).

Vc pode se guiar pelos novos templates se achar mais fácil, os arquivos deste repositorio foram atualizados.

Segue aqui o commit com as alterações realizadas, a titulo de referencia:
666dc31
a01c183

Problemas com o 'vetores_de_palavras.png'

Estou enfrentando um problema de verificação na entrega da semana 04 no curso "Processamento Neural de Linguagem Natural em Português I" no Coursera.

Tanto na plataforma quanto localmente os arquivos 'sgd.py' e 'word2vec.py' detêm resultados corretos, no entanto, ao entregar a imagem 'vetores_de_palavras.png' não obtenho qualquer tipo de nota, o contador de notas fica zerado como mostra o anexo.

Se for possível, gostaria que analisassem este problema.
Desde já, grato pela atenção.

PS: Estou incluindo também no anexo os arquivo 'sgd.py', 'word2vec.py' e 'vetores_de_palavras.png' para possível análise. No entanto, como o GitHub não suporta a extensão '.py', a extensão destes arquivos estará como '.txt'.

Screenshot 2024-03-19 at 16-27-25 Implementando word2vec Coursera
vetores_de_palavras
word2vec.txt
sgd.txt

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.