Методы и алгоритмы для извлечения, связывания, векторизации и разрешения неоднозначности лексико-семантических графовMethods and Algorithms for Extraction, Linking, Vectorisation, and Disambiguation of Lexical-Semantic Graphs
Соискатель:
Панченко Александр Иванович
Члены комитета:
Кольцов Сергей Николаевич ( НИУ ВШЭ Спб, д.комп. н., председатель комитета), Бурнаев Евгений Владимирович (профессор, д.ф.-м.н., член комитета), Николенко Сергей Игоревич (профессор, д.ф.-м.н., член комитета), Соловьев Валерий Дмитриевич (Казанский федеральный университет, д.ф.-м.н, член комитета), Воронцов Константин Вячеславович (ММП МГУ им. М. В. Ломоносова, д.ф.-м.н., член комитета)
Диссертация принята к предварительному рассмотрению:
6/13/2024
Диссертация принята к защите:
9/19/2024
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
12/18/2024
Диссертационная работа представляет собой комплексное исследование, направленное на разработку методов вычислительной лексической семантики, которые позволили бы преодолеть методологический разрыв между построенными вручную лексическими ресурсами, такими как WordNet, и дистрибутивными графами извлеченными из текстов. Для достижения этой цели, были разработаны новые методы и алгоритмы для (1) кластеризации больших лингвистических графов; (2) извлечения лексико-семантических структур из текста, таких как значения слов и отношения между ними; (3) устранения неоднозначности смысла слов и лексической замены в контексте; (4) связывания смыслов слов извлеченных из текста с лексическими ресурсами; (5) векторизации узлов лексико-семантических графов; (6) извлечения гиперонимов и построения таксономий. Эффективность предложенных методов и алгоритмов подтверждена в рамках большого числа вычислительных экспериментов и открытых тестирований. Реализация предложенных методов и другие материалы находятся в открытом доступе.
Диссертация [*.pdf, 12.74 Мб] (дата размещения 10/1/2024)
Резюме [*.pdf, 2.86 Мб] (дата размещения 10/1/2024)
Summary [*.pdf, 2.58 Мб] (дата размещения 10/1/2024)
Публикации, в которых излагаются основные результаты диссертации
Faralli S., Panchenko A., Biemann C., Ponzetto S.P. Linked Disambiguated Distributional Semantic Networks (смотреть на сайте журнала)
Pelevina M., Arefiev N., Biemann C., Panchenko A. Making Sense of Word Embeddings (смотреть на сайте журнала)
Panchenko A., Ruppert E., Faralli S., Ponzetto S.P., Biemann C. Unsupervised does not mean uninterpretable: The case for word sense induction and disambiguation (смотреть на сайте журнала)
Ustalov D., Arefyev N., Biemann C., Panchenko A. Negative Sampling Improves Hypernymy Extraction Based on Projection Learning (смотреть на сайте журнала)
Ustalov D., Panchenko A., Biemann C. Watset: Automatic Induction of Synsets from a Graph of Synonyms (смотреть на сайте журнала)
Panchenko A., Marten F., Ruppert E., Faralli S., Ustalov D., Ponzetto S.P., Biemann C. Unsupervised, Knowledge-Free, and Interpretable Word Sense Disambiguation (смотреть на сайте журнала)
Panchenko A., Ustalov D., Faralli S., Ponzetto S.P., Biemann C. Improving Hypernymy Extraction with Distributional Semantic Classes (смотреть на сайте журнала)
Ustalov D., Panchenko A., Kutuzov A., Biemann C., Ponzetto S.P. Unsupervised Semantic Frame Induction using Triclustering (смотреть на сайте журнала)
Biemann C., Faralli S., Panchenko A., Ponzetto S.P. A framework for enriching lexical semantic resources with distributional semantics (смотреть на сайте журнала)
Kutuzov A., Dorgham M., Oliynyk O., Biemann C., Panchenko A. Making Fast Graph-based Algorithms with Graph Metric Embeddings (смотреть на сайте журнала)
Aly R., Acharya S., Ossa A., Kohn A., Biemann C., Panchenko A. Every child should have parents: a taxonomy refinement algorithm based on hyperbolic term embeddings (смотреть на сайте журнала)
Ustalov D., Panchenko A., Biemann C., Ponzetto S.P. Watset: Local-Global Graph Clustering with Applications in Sense and Frame Induction (смотреть на сайте журнала)
Logacheva V., Teslenko D., Shelmanov A., Remus S., Ustalov D., Kutuzov A., Artemova E., Biemann C., Ponzetto S.P., Panchenko A. Word Sense Disambiguation for 158 Languages using Word Embeddings Only (смотреть на сайте журнала)
Arefyev N., Sheludko B., Podolskiy A., Panchenko A. Always Keep your Target in Mind: Studying Semantics and Improving Performance of Neural Lexical Substitution (смотреть на сайте журнала)
Отзывы
Отзыв члена Комитета
- Соловьев Валерий Дмитриевич (дата размещения 12/3/2024)
- Николенко Сергей Игоревич (дата размещения 12/3/2024)
- Кольцов Сергей Николаевич (дата размещения 12/3/2024)
- Бурнаев Евгений Владимирович (дата размещения 12/3/2024)
- Воронцов Константин Вячеславович (дата размещения 12/3/2024)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень доктора наук с отличием (протокол № 2 от 18.12.2024); ;Решением диссертационного совета (протокол № 13 от 26.12.2024) присуждена ученая степень доктора компьютерных наук с отличием.
См. на ту же тему
Методы глубинного обучения для предсказания Z-ДНК на основе омиксных данныхКандидатская диссертация
Соискатель: Бекназаров Назар Сохибжонович
Руководитель: Попцова Мария Сергеевна
Методы и наборы данных для оценки моделей информационного поиска и обработки естественного языкаДокторская диссертация
Соискатель: Браславский Павел Исаакович
Выявление и оценка характеристик социального разгона российских акций на основе анализа публикаций в социальных сетяхКандидатская диссертация
Соискатель: Хазиев Глеб Андреевич
Руководитель: Соколова Татьяна Владимировна