• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Реализация менеджера онтологий информационной системы агентства недвижимости

ФИО студента: Глухов Роман Игоревич

Руководитель: Лядова Людмила Николаевна

Кампус/факультет: Факультет экономики, менеджмента и бизнес-информатики

Программа: Бакалавриат

Год защиты: 2014

<p align="center">Аннотация к выпускной квалификационной работе на тему:</p><p align="center">&laquo;Реализация менеджера онтологий информационной системы<br />агентства недвижимости&raquo;</p><p>Студента группы БИ-10-2 <strong>Глухов Романа Игоревича</strong></p><p>В данной работе рассматривается задача автоматизированного поиска объявлений о недвижимости в сети Интернет. Целью работы является разработка приложения, которое предназначено для поиска и извлечения информации из предложений на рынке недвижимости в сети Интернет.</p><p>На сегодняшний день существуют различные сервисы, предназначенные для поиска и извлечения структурированной информации. Сервисы используют различные подходы, например, извлечение данных с последующей их обработкой и загрузкой в базу данных. К преимуществам данного подхода можно отнести тот факт, что при загрузке данные структурируются. Это позволяет быстро общаться к уже загруженным данным. К минусам данного подхода можно отнести то, что обработка информации с информационные порталов по недвижимости, в частности с бесплатных досок объявлений (организованных баз данных), не всегда дает ее правильную классификацию и, следовательно, при запросе может встретиться не релевантная информация. Стоит заметить, что данный подход наиболее полезен для извлечения данных с сайтов, где информация четко структурирована.</p><p>В данной работе был реализован метод, позволяющий обращаться к источникам данных в Интернет с учетом их с способа их представления, принятой классификации и т.п. На бесплатных поисковых порталах при добавлении нового объявления пользователю необходимо заполнить основные и дополнительные своего объявления для того, чтобы люди смогли быстро его найти, то есть в базу попадает уже &laquo;проклассифицированная&raquo; информация. При поиске того или иного объявления запрос формируется путем его последовательного усложнения, то есть добавления новых критериев отбора (тип объявления (продажа, съем, покупка); местоположение (район, микрорайон, точный адрес); тип дома (сталинский, хрущевский и т.п.); материал (кирпич, панель и т.п.); площадь; диапазон цены). В дальнейшем запрос обрабатывается &laquo;скриптом&raquo; и вытягивает из базы предложения, соответствующие запросу. В адресной строке появляется заголовок, каждая часть которого &ndash; это ранее указанный фильтр.</p><p>В ходе работы был проведен анализ сайтов-источников &laquo;Авито&raquo; и &laquo;Из рук в руки&raquo;, в результате анализа были выделены основные разделы и фильтры по категории недвижимость, на их основе была разработана онтология. Онтология позволяет описать в виде троек (субъект, предикат, субъект) различные суждения об экземплярах объектов предметной области. Благодаря этому один и тот же экземпляр понятия онтологии можно описать по-разному, например, для &laquo;Авито&raquo; субъект &laquo;Rooms&raquo;, предикат &laquo;One-rooms&raquo;, субъект &laquo;/1-komnatnye&raquo;; для &laquo;Из рук в руки&raquo; субъект &laquo;Rooms&raquo;, предикат &laquo;One-rooms&raquo;, субъект &laquo;/rooms=1&raquo;. Метод основан на последовательном построении адресной строки для которой будет произведен запрос, путем извлечения данных из онтологии, соответствующих указанному пользователем фильтру. На данном этапе прототип приложения позволяет построить корректный запрос к сайту источнику &laquo;Авито&raquo;, в дальнейшем планируется реализовать это для портала &laquo;Из рук в руки&raquo;. Положительной стороной данного подхода является то, что мы получаем релевантные запросу пользователя данные; отрицательной стороной является то, что при каждом запросе необходимо обращаться к интернет источнику.</p><p>Решение задачи поиска предложений на рынке недвижимости разделено на несколько этапов. На первом этапе рассматривается извлечение необходимой информации из онтологии. На втором этапе происходит формирование адресной строки из значений, которые мы получили из онтологии. На третьем этапе происходит запрос к сайту и загрузка информации по xpath-запросам.</p><p>В ходе работы была изучена библиотека OwlDotNetApi, способная обрабатывать данные из онтологии. Так же был проанализирован сервис &laquo;ИВС&raquo;, использующий эту библиотеку для решения задачи поиска информации другим методом. На основе алгоритмов сервиса были описаны алгоритмы для решения поставленной задачи. В свою очередь непосредственно для извлечения данных из html-страниц была разобрана библиотека HtmlAgilityPack и были описаны алгоритмы для извлечения информации из HTML-документов.</p><p>В работе представлено приложение Windows Forms, разработанное в среде Visual Studio, которое реализует поиск предложений о недвижимости по запрашиваемым критериям. Прототип приложения позволит получать релевантные запросу объявления с сайта &laquo;Авито&raquo;.</p>

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ