• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
ФИО студента
Название работы
Руководитель
Факультет
Программа
Оценка
Год защиты
Маркин Алексей Константинович
Программа бикластерного анализа для текстовых данных Интернета
9
2015
Объектом разработки является программа бикластерного анализа текстовых данных. Методы бикластерного анализа на сегодняшний день получили довольно широкое применение в области биоинформатики и вычислительной биологии. Также за последние 15 лет идея бикластеризации успела проникнуть в область анализа текстовых данных. Однако на сегодняшний день не существует специализированного программного обеспечения для анализа текстов. Целью данной работы является создание такого инструмента. Реализованный программный продукт позволяет проводить бикластерный анализ матриц релевантности словосочетание/текст, а также матриц схожести между словосочетаниями. Бикластеризация матриц схожести между словосочетаниями является новой и практически неисследованной задачей в области анализа текстовых данных. Программа также предоставляет возможность загружать аннотации к научным статьям из таких электронных библиотек, как IEEE Xplore и Springer, и выделять ключевые слова и словосочетания из коллекции текстов для анализа. В дополнение, мы представляем новый алгоритм бикластерного анализа, основанный на предыдущих достижениях в этой области, а именно на существующих методах «коробочной» кластеризации. Эксперименты над коллекциями аннотаций к научным статьям показали, что этот алгоритм показывает хорошие результаты как по скорости работы, так и по «качеству» находимых им бикластеров. В данной работе мы также исследуем возможное применение бикластеров ключевых словосочетаний для построения графов связей между фразами, отражающими тематическую структуру коллекции. Работа содержит 47 страниц, 4 главы, 4 таблицы, 6 иллюстраций, 42 источника и 6 приложений. Ключевые слова: анализ текстовых данных, бикластерный анализ, коробочная кластеризация, бикластеризация словосочетаний.
Текст работы (работа добавлена 28 мая 2015г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Расширенный поиск ВКР