Основная задача курса — познакомить слушателей с постановками задач, специфичных для области обработки текстов (natural language processing, NLP), и рассказать актуальные подходы к их решению.
В курсе будут рассмотрены, как и современные подходы к обработке текстов, так и классические методы,
не утратившие актуальность. Большое внимание будет уделено моделям векторизации слов и предложений (например, word2vec, fasttext) и моделям переноса обучения (например, BERT, RoBERTa). Будут подробно рассмотрены задачи разметки последовательности (sequence tagging)
и генерации естественного языка (language generation).
Практические задания будут посвящены решению рассмотренных на лекциях прикладных задач при помощи языка Python и библиотеки pytorch. Также, каждому студенту предстоит выбрать тему и сделать по ней небольшой проект, посвящённый NLP.