Естественный язык, как и многие другие сложные системы и явления, удобно представлять и изучать в виде графов. Благодаря теоретико-графовым представлениям эффективно решаются многие задачи естественного языка и информационного поиска: извлекаются ключевые слова, определяются их значения, идентифицируются языки, и др.
Данный открытый курс начнётся с классических теоретико-графовых подходов к обработке естественного языка и информационному поиску, таких как TextRank и марковская кластеризация, и завершится современными методами на основе машинного обучения, такими как StarSpace и графовые свёрточные сети. Особое внимание уделяется оценке качества описанных методов при помощи как автоматических, так и экспертных оценок. Курс состоит из пяти лекций:
Описанные в курсе методы представляются с подробным пошаговым разбором и изучением свойств, как теоретических, так и практических. Курс предназначен для студентов, аспирантов, аналитиков данных, исследователей в области обработки естественного языка и информационного поиска (но не ограничивается ими).
Лекции читаются на русском языке, но слайды представлены на английском языке.
Дата и время | Занятие | Место | Материалы |
---|---|---|---|
17 апреля 18:00–19:30 |
Язык и графы, Лекция | Конференция в zoom, Онлайн | |
24 апреля 18:00–19:30 |
Кластеризация графов, Лекция | Конференция в zoom, Онлайн | |
08 мая 18:00–19:30 |
Векторные представления графов, Лекция | Конференция в zoom, Онлайн | |
15 мая 18:00–19:30 |
Оценка качества, Лекция | Конференция в zoom, Онлайн | |
22 мая 18:00–19:30 |
Краудсорсинг, Лекция | Конференция в zoom, Онлайн |