• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Система сбора, распознавания и обработки текстовых данных на примере рынка ветеринарных услуг

ФИО студента: Панкратова Анна Сергеевна

Руководитель: Радченко Ирина Алексеевна

Кампус/факультет: Факультет креативных индустрий

Программа: Журналистика данных (Магистратура)

Оценка: 8

Год защиты: 2019

Данная работа состоит из двух частей: теоретической и практической. В первой главе рассматриваются основные определения, связанные с такими областями как теория баз данных, нормализация данных, особенности различного веб-скрапинга и процесса очистки баз данных. Сравниваются определения из различных источников. Также дается определение и основной «функционал», используемым в работе программам и технологиям. Во второй главе описывается процесс веб-скрапинга текстовых данных на примере нескольких ветеринарных клиник Москвы. Также показывается пример создания прототипа базы структурированных данных.

Текст работы (работа добавлена 15 мая 2019 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ