Домашняя работа состояла из 3 ДЗ и 2 лаб. Результаты и выводы можно посмотреть в соответствующих ноутбуках.
ДЗ_1 было на простую обработку текста и выявления токсичности. В качестве классификаторов был предложено поработать с логистической регрессией, наивным байесовским классификатором. Внедрить bag of words, tf-idf и word2vec.
ДЗ_2 было на машинный перевод без использования параллельных корпусов, но на примере родственных славянских языков
В ДЗ_3 уже нужно было реализовать собственные классы и методы для Seq2Seq для машинного перевода. Работа было проделана большая, выводы можно почитать в конце ноутбука
В Лаба_1 нужно было обучить RNN для генерации стихов. Времени на лабу особо не было, но в целом определённых успехов я добился
Лаба_2 была логическим продолжением ДЗ_3. В ней нужно было реализовать и обучить еще несколько переводчиков, мной был реализовал GRU и GRU+Attention. Выводы так же можно почитать в конце