Город: Санкт-Петербург Новосибирск Казань Язык: Русский English

Язык, вычисления и графы


Естественный язык, как и многие другие сложные системы и явления, удобно представлять и изучать в виде графов. Благодаря теоретико-графовым представлениям эффективно решаются многие задачи естественного языка и информационного поиска: извлекаются ключевые слова, определяются их значения, идентифицируются языки, и др.

Данный открытый курс начнётся с классических теоретико-графовых подходов к обработке естественного языка и информационному поиску, таких как TextRank и марковская кластеризация, и завершится современными методами на основе машинного обучения, такими как StarSpace и графовые свёрточные сети. Особое внимание уделяется оценке качества описанных методов при помощи как автоматических, так и экспертных оценок. Курс состоит из пяти лекций:

  1. Язык и графы
  2. Кластеризация графов
  3. Машинное обучение с графами
  4. Оценка качества
  5. Краудсорсинг

Описанные в курсе методы представляются с подробным пошаговым разбором и изучением свойств, как теоретических, так и практических. Курс предназначен для студентов, аспирантов, аналитиков данных, исследователей в области обработки естественного языка и информационного поиска (но не ограничивается ими).

Прочтения курсов

Семестр Отделение
весна 2021 Санкт-Петербург