• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Версия для слабовидящихЛичный кабинет сотрудника ВШЭПоискМеню

Разработка и исследование новых методов создания распределенных энергосберегающих вычислительных систем для семантического поиска текстовой информации на основе модели вычислений с управлением потоком данных

2013
Руководитель: Леохин Юрий Львович
Подразделение: Лаборатория распределенных вычислительных систем

Объектом исследования является система семантического анализа естественного языка (ЕЯ), построенная на базе распределенной вычислительной системы с управлением потоком данных (dataflow).

Целью исследования является разработка целостной концепции,  охватывающей все этапы и уровни разработки вычислительной системы для семантического анализа ЕЯ.

Задачами исследования являются:

1. анализ источников по тематике исследования и выбор дальнейшего направления исследования;

2. разработка методики семантического анализа ЕЯ, обеспечивающей эффективную работу с полисемией лексем и языковых конструкций;

3. разработка формата данных для описания языка в системе семантического анализа ЕЯ;

4. разработка способа описания правил обработки естественного языка;

5. разработка формальной модели вычислительной системы для семантического анализа ЕЯ;

6. разработка архитектуры распределенной вычислительной системы (перечень устройств, входящих в состав вычислительной системы; наборы команд устройств; функциональные схемы и т.д.) для семантического разбора текста на ЕЯ и семантического поиска;

7. разработка языка программирования для описания базы знаний;

8. создание экспериментальной программной модели вычислительной системы для семантического разбора ЕЯ.

Новизна работы заключается в том, что для реализации системы анализа ЕЯ была выбрана архитектура вычислительной системы (ВС) с управлением потоком данных, а точнее, объектно-атрибутная архитектура ВС – собственная разработка МИЭМ НИУ ВШЭ. Новизной решения поставленной в НИР задачи также является то, что предлагаемая методика семантического анализа ЕЯ охватывает все этапы и уровни вычислительной системы: аппаратная и программная архитектура ВС, язык программирования, формат данных, формализация правил семантического анализа ЕЯ. Причем все уровни работают с применением единой философии организации вычислительного процесса.

Результатами работы являются: формат данных для описания лексем, методика семантического анализа ЕЯ, архитектура распределенной ВС для семантического анализа, формальная модель описания правил синтеза семантического графа текста, формальная модель описания вычислительного процесса в ВС, реализация экспериментальной базы знаний для анализа русского и английского языков.

Результаты НИР смогут найти применение в следующих областях: информационный поиск в Интернет, автоматическое реферирование, классификация документов, системы искусственного интеллекта, робототехника, интеллектуальные интерфейсы человек-компьютер.

Публикации по проекту:


Леохин Ю. Л., Мягков А. С. Разработка подхода к организации потоков данных в многопроцессорной вычислительной системе с кольцевой архитектурой // Информатизация образования и науки. 2013. Т. 40. № 4. C. 58-67. 
Салибекян С. М., Панфилов П. Б. Формализация dataflow-модели вычислительного процесса, in: Объектные системы - 2013: материалы VII Международной научно-практической конференции, Ростов-на-Дону, 10-12 мая 2013 г.. Ростов-на-Дону , 2013. С. 87-93. 
Leokhin, Y., Myagkov, A., Panfilov, P. Gomapreduce parallel computing model implementation on a cluster of plan9 virtual machines, in: 26th DAAAM International Symposium on Intelligent Manufacturing and Automation 2015. New York : Curran Associates, Inc., 2015. С. 0656 - 0662.