• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Онтологии и инженерия знаний

Направление: 45.04.03. Фундаментальная и прикладная лингвистика
Когда читается: 2-й курс, 1, 2 модуль
Формат изучения: без онлайн-курса
Прогр. обучения: Цифровые методы в гуманитарных науках
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Цель курса — познакомиться с еще одним, более комплексным способом представления данных — “связанными данными” (Linked Data) или “знаниями” (knowledge) и преимуществами его использования в исследовательских задачах . Курс посвящён работе с модулями для извлечения и структурирования информации, базами знаний, а также валидации извлеченных данных и моделей. Часть курса посвящена изучению основ построения онтологий, и понятий «класс», «объект», “связь”, «наследование», “знание” и “граф” и “предметная область”.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель освоения дисциплины — познакомить студентов с подходами к формальному моделированию человеческого знания и дать практический опыт такого моделирования.
  • В процессе освоения курса студент: — узнает об основных принципах извлечения и структурирования информации из неструктурированных данных (изображения, текст) — научится использовать средства языка Python для работы со связанными данными (Linked Data) в задачах цифровой гуманитаристики. — научится строить онтологии и графы знаний на основе извлеченных данных — узнает об особенностях и преимуществах использования связанных данных в исследованиях
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимает разницу между данными и знаниями
  • Знает теоретические основы онтологического инжиниринга
  • умение сформулировать исследовательскую задачу и обосновать использование связанных данных в ней
  • владение библиотеками языка Python для построения графов знаний и онтологий
  • владение библиотеками языка Python для извлечения информации из текста
  • владение библиотеками языка Python для валидации извлеченных знаний и моделей извлечения/структурирования данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Данные и знания. Отличия данных от знаний. Основные способы формального представления знаний. Место онтологий в инженерии знаний
    Информация, данные и знания. Основные отличия данных и знаний. Основные способы представления знаний: фреймы, сценарии, продукции. Семантические сети. Шкалы. Лингвистические шкалы. Классические и неклассические логики и вывод на знаниях. Формальные модели различных классов. Место онтологий в инженерии знаний. Взаимосвязи онтологического инжиниринга и семантических технологий с компьютерной лингвистикой
  • Введение в инженерию знаний
    Что такое “knowledge” и “linked data”. Графы как способ репрезентации информации, их проблемы и возможности. Онтологии. Знакомство с терминами, обзор на технологии
  • Графы знаний в задачах цифровой гуманитаристики.
    Более детальное погружение в концепт “knowledge graph”. Возможности применения + практическая часть (создание графа из предложенных данных + демонстрация возможностей его использования в рамках задачи)
  • Организация знаний.
    Онтологии vs графы знаний vs тезаурусы. Иерархия концептов внутри онтологии. Дизайн онтологий, их проблемы
  • Онтологический инжиниринг: практическое применение
    Построение онтологии из заданных данных. Практическое занятие.
  • Knowledge mining.
    Сравнение подходов и случаев использования Information Retrieval, Information Extraction и Knowledge extraction . +Практическая часть
  • Базы знаний
    Базы знаний. Как организовать данные , извлеченные в процессе knowledge mining/ information extraction
  • Knowledge + systems evaluation
    Как оценить извлеченную информацию и работу системы извлечения знаний
Элементы контроля

Элементы контроля

  • неблокирующий Проект по моделированию данных в Digital Humanities
    Проект представляет собой программу, написанную индивидуально на оригинальную тему, с постановкой исследовательского вопроса и предложением его решения.
  • неблокирующий Домашнее задание (занятие 3): построение онтологии
  • неблокирующий Домашнее задание (занятие 5): построение графа знаний
  • неблокирующий Домашнее задание (занятие 7): оценка работы систем
  • неблокирующий Тест по темам курса
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.1 * Домашнее задание (занятие 3): построение онтологии + 0.1 * Домашнее задание (занятие 5): построение графа знаний + 0.1 * Домашнее задание (занятие 7): оценка работы систем + 0.4 * Проект по моделированию данных в Digital Humanities + 0.3 * Тест по темам курса
Список литературы

Список литературы

Рекомендуемая основная литература

  • Natalya F. Noy, & Deborah L. Mcguinness. (2001). Ontology Development 101: A Guide to Creating Your First Ontology. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.B329F4D

Рекомендуемая дополнительная литература

  • Gavrilova, T.A. Knowledge Engineering: learning and application guide [Электронный ресурс] / T. A. Gavrilova, S. V. Zhukova; Graduate School of Management SPbSU. — SPb.: Publishing Centre “Graduate School of Management”, 2012. — p. 133. - Режим доступа: http://znanium.com/catalog/product/492828