Оценка неопределенности в задачах обработки естественного языкаUncertainty Quantification in Natural Language Processing
Соискатель:
Важенцев Артем Андреевич
Руководитель:
Панченко Александр Иванович (др. работы под рук-вом)
Члены комитета:
Кольцов Сергей Николаевич (НИУ ВШЭ, д.комп.н., председатель комитета), Ветров Дмитрий Петрович (НИУ ВШЭ, к.ф.-м.н., член комитета), Иванов Владимир Владимирович (Университет Иннополис, к.ф.-м.н., член комитета), Николенко Сергей Игоревич (Санкт-Петербургское отделение Математического института им. В.А. Стеклова РАН, д.ф.-м.н., член комитета), Соченков Илья Владимирович (Институт проблем передачи информации им. А.А. Харкевича РАН, к.ф.-м.н., член комитета)
Диссертация принята к предварительному рассмотрению:
8/7/2025
Диссертация принята к защите:
9/18/2025
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
11/21/2025
Uncertainty quantification (UQ) has emerged as a promising approach for addressing several key challenges in natural language processing (NLP), particularly in mitigating the risks of errors in text classification and detecting hallucinations or low-quality outputs in text generation. Although UQ is a rapidly growing field within classification tasks, state-of-the-art methods often show poor performance or underperform trivial methods for ambiguous tasks such as toxicity detection. Furthermore, despite significant progress in UQ techniques for text classification tasks, applying UQ to large language models (LLMs) introduces additional complexity due to the conditional dependency between generation steps and the varying influence of tokens on the predictions in autoregressive models. As a result, many UQ techniques that are effective for classification models are either ineffective or not directly applicable to LLMs. This thesis addresses these challenges by developing novel methods for robust uncertainty quantification for both text classification and text generation tasks. For classification tasks, we propose a hybrid approach that combines both epistemic and aleatoric uncertainty, outperforming existing methods and providing a more reliable selective classification. For LLMs, we introduce several innovative techniques that leverage attention-based features or token embeddings to quantify uncertainty effectively. These methods are designed to handle the sequential and conditional nature of LLM outputs, enabling improved selective generation and fact-checking.
Диссертация [*.pdf, 5.47 Мб] (дата размещения 9/19/2025)
Резюме [*.pdf, 1.56 Мб] (дата размещения 9/19/2025)
Summary [*.pdf, 1.53 Мб] (дата размещения 9/19/2025)
Публикации, в которых излагаются основные результаты диссертации
Vazhentsev A., Kuzmin G., Tsvigun A., Panchenko A., Panov M., Burtsev M., Shelmanov A. Hybrid Uncertainty Quantification for Selective Text Classification in Ambiguous Tasks (смотреть на сайте журнала)
Vazhentsev A., Tsvigun A., Vashurin R., Petrakov S., Vasilev D., Panov M.,Panchenko A., Shelmanov A. Efficient Out-of-Domain Detection for Sequence to Sequence Models (смотреть на сайте журнала)
Vashurin R., Fadeeva E., Vazhentsev A., Rvanova L., Vasilev D., Tsvigun A., Petrakov S., Xing R., Sadallah A., Grishchenkov K., Panchenko A., Baldwin T., Nakov P., Panov M., Shelmanov A. Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph (смотреть на сайте журнала)
Vazhentsev A., Rvanova L., Lazichny I., Panchenko A., Panov M., Baldwin T., Shelmanov A. Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models (смотреть на сайте журнала)
Отзывы
Отзыв научного руководителя
- Отзыв научного руководителя (дата размещения 8/12/2025)
Отзыв члена Комитета
- Ветров Дмитрий Петрович (дата размещения 11/14/2025)
- Кольцов Сергей Николаевич (дата размещения 11/14/2025)
- Николенко Сергей Игоревич (дата размещения 11/14/2025)
- Соченков Илья Владимирович (дата размещения 11/14/2025)
- Иванов Владимир Владимирович (дата размещения 11/17/2025)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук с отличием (протокол № 2 от 21.11.2025). Решением диссертационного совета (протокол № 11 от 27.11.2025) присуждена ученая степень кандидата компьютерных наук с отличием.