Номинация "Достижения в науке". Претенденты 2010 Фомичев Владимир Александрович, профессор кафедры инноваций и бизнеса в сфере информационных технологий
За подготовку и опубликование монографии Vladimir A. Fomichov. Semantics-Oriented Natural Language Processing: Mathematical Models and Algorithms. Springer: New York, Dordrecht, Heidelberg, London, 2010.- 354 p., предложившей оригинальную стратегию преобразования существующего Всемирного Веба в Семантический Веб нового поколения (СВ-2, Мультилингвистический Семантический Веб) и базовые формальные инструменты для реализации этой стратегии.
Кем выдвинут: факультет бизнес-информатики ГУ-ВШЭ, ученый совет бизнес-информатики.
Монография Vladimir A. Fomichov. Semantics-Oriented Natural Language Processing: Mathematical Models and Algorithms. Series: IFSR (International Federation for Systems Research) International Series on Systems Science and Engineering, Vol. 27, Springer: New York, Dordrecht, Heidelberg, London, 2010.-354 p. (Фомичев В.А. Семантически-ориентированная обработка естественного языка: математические модели и алгоритмы, Шпрингер, 2010) состоит из двух частей. Часть I: Комплексный математический аппарат для разработки семантических технологий (главы 1 – 6). Часть II: Формальные методы и алгоритмы для проектирования семантически-ориентированных лингвистических процессоров (главы 7 - 11).
Фомичев Владимир Александрович
Среди основных результатов монографии можно выделить четыре:
- Предложена единственная в мировой научной литературе теория математического описания содержания (смысла, смысловой структуры) произвольных (по гипотезе автора) естественно-языковых текстов (ЕЯ–текстов), относящихся к деловой прозе (т.е. текстов коммерческих контрактов на русском, английском и других языках, описаний технологий, описаний симптомов заболевания и т.д.). На русском языке этот результат был изложен в монографии В.А. Фомичева «Математические основы представления содержания посланий компьютерных интеллектуальных агентов», ГУ-ВШЭ, издательство «ТЕИС», 2007.
- Впервые в мировой научной литературе предложена широко применимая математическая модель лингвистической базы данных, т.е. базы данных со сведениями, используемыми алгоритмами семантико-синтаксического анализа для построения по ЕЯ-тексту его семантического представления.
- Впервые в мировой научной литературе столь полно, явно и независимо от программной среды (с помощью оригинальных формальных понятий) представлен алгоритм преобразования ЕЯ–текстов в их семантические представления. Описание оригинального мультилингвистического алгоритма семантико-синтаксического анализа ЕЯ-текстов (вместе с описанием используемых структур данных) из представляющих практический интерес подъязыков русского, английского и немецкого языков дано в главах 8, 9 и 10 монографии (99 печатных страниц).
- Сформулирована оригинальная стратегия преобразования существующего Всемирного Веба в Семантический Веб нового поколения (СВ-2, Мультилингвистический Семантический Веб) и разработаны базовые формальные инструменты для реализации этой стратегии. Главной отличительной чертой предлагаемого СВ-2 является хорошо развитая способность обработки естественного языка. Центральная идея стратегии заключается в использовании единой формальной среды – аппарата СК-языков, предложенного в главах 2 – 6 данной монографии – в следующих направлениях: (а) для формального отображения смысла (или содержания) произвольных ЕЯ-текстов, т.е. для построения семантических представлений ЕЯ-текстов; (б) для представления в едином формате фрагментов знаний о мире, хранящихся в существующих онтологиях; (в) для разработки онтологий нового поколения, обладающих значительно большими выразительными возможностями по сравнению с существующими; (г) для построения семантических аннотаций разнообразных электронных документов и Веб-сервисов: (д) для построения концептуальных описаний изображений, хранящихся в мультимедийных базах данных; (е) для представления содержания посланий компьютерных интеллектуальных агентов в многоагентных системах. Реализация стратегия обещает привести к значительному повышению глобальной эффективности, результативности идущего (в большой степени децентрализованного) процесса наделения Веба способностью семантической обработки текстов на многих естественных языках.
Появление монографии означает, что ГУ-ВШЭ вошел в группу мировых лидеров (университетов и научных центров, ведущих компьютерных и Интернет-фирм) в двух пересекающихся областях: разработке теоретических основ Семантической Всемирной Паутины (Семантического Веба) и математической информатике (математическая теория прикладных интеллектуальных систем, в том числе лингвистических процессоров; математические методы представления знаний о предметных областях в онтологиях нового поколения).
Положительная рецензия на монографию опубликована в феврале 2010 г. в международном научном журнале «Электронная технология» (Journal of E-technology, 2010, No. 1).
По данным, опубликованным в феврале 2010 г. на сайте изд-ва Шпрингер, монография используется в качестве учебного пособия в Стенфордском университете (отделение лингвистики), Школе инженерных наук Университета Южной Калифорнии (один из крупнейших частных исследовательских университетов в мире), Университете Стоуни Брук, штат Нью-Йорк, США, отделение компьютерной науки, Университете Северной Каролины (Чейпел Хил), отделение когнитивных наук. По данным переписки, монография используется в научных исследованиях в Университете г. Монтпелье, Франция (отделение компьютерной науки), Институте Йожефа Штефана (центральный научный институт Словении, Любляна) и Институте информационно-коммуникационных технологий Академии наук Болгарии, София.
На 22-й международной научной конференции по системным исследованиям, информатике и кибернетике (Германия, 2 – 6 августа 2010) за публикацию монографии В.А. Фомичеву была присуждена награда Международного института передовых исследований по теории систем и кибернетике (это организатор конференции – международная научная ассоциация, существующая с 1980-го года, штаб-квартира в Онтарио, Канада) за лучшую книгу 2010 года.
Полный текст монографии с декабря 2009 г. доступен через электронную библиотеку ГУ-ВШЭ.