Материалы и домашние задания факультатива "Анализ естественного языка методами искусственного интеллекта"
Для каждого занятия имеются дополнительные материалы - "itmo_elective_links_N.md"
Преподаватель - Желтова Кристина Анатольевна
План занятий:
1.1 Знакомство с основными задачи в обработке естественного языка
1.2 Обзор базовых методов предобработки текстов - нормализация, стемминг/лемматизация, морфологический анализ
2.1 Представления текстовых данных: Методы Bag of Words, Tf-Idf
2.2 Классификация текстов (классический ML)
3.1 DL crash course (погружение в глубокое обучение
3.2 Представления текстовых данных: Word2Vec
4.1 Transfer learning в задачах анализа текстов. Архитектуры трансформеров: BERT, GPT
4.2 Машинный перевод
5.1 Генерация текстов
5.2 Автоматическое реферирование (summarization)
5.3 Question answering (построение вопросно-ответных систем)
6.1 Conversational AI - построение диалоговых систем
2 домашних задания:
• Предобработка, векторизация и классификация текстов
• Transfer Learning, дообучение модели классификации/генерации текстов