Магистратура
2020/2021
Онтологии и инженерия знаний
Статус:
Курс по выбору (Цифровые методы в гуманитарных науках)
Направление:
45.04.03. Фундаментальная и прикладная лингвистика
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Кловайт Анастасия Алексеевна
Прогр. обучения:
Цифровые методы в гуманитарных науках
Язык:
русский
Кредиты:
3
Контактные часы:
32
Программа дисциплины
Аннотация
Цель курса — познакомиться с еще одним, более комплексным способом представления данных — “связанными данными” (Linked Data) или “знаниями” (knowledge) и преимуществами его использования в исследовательских задачах . Курс посвящён работе с модулями для извлечения и структурирования информации, базами знаний, а также валидации извлеченных данных и моделей. Часть курса посвящена изучению основ построения онтологий, и понятий «класс», «объект», “связь”, «наследование», “знание” и “граф” и “предметная область”.
Цель освоения дисциплины
- Цель освоения дисциплины — познакомить студентов с подходами к формальному моделированию человеческого знания и дать практический опыт такого моделирования.
- В процессе освоения курса студент: — узнает об основных принципах извлечения и структурирования информации из неструктурированных данных (изображения, текст) — научится использовать средства языка Python для работы со связанными данными (Linked Data) в задачах цифровой гуманитаристики. — научится строить онтологии и графы знаний на основе извлеченных данных — узнает об особенностях и преимуществах использования связанных данных в исследованиях
Планируемые результаты обучения
- Понимает разницу между данными и знаниями
- Знает теоретические основы онтологического инжиниринга
- умение сформулировать исследовательскую задачу и обосновать использование связанных данных в ней
- владение библиотеками языка Python для построения графов знаний и онтологий
- владение библиотеками языка Python для извлечения информации из текста
- владение библиотеками языка Python для валидации извлеченных знаний и моделей извлечения/структурирования данных
Содержание учебной дисциплины
- Данные и знания. Отличия данных от знаний. Основные способы формального представления знаний. Место онтологий в инженерии знанийИнформация, данные и знания. Основные отличия данных и знаний. Основные способы представления знаний: фреймы, сценарии, продукции. Семантические сети. Шкалы. Лингвистические шкалы. Классические и неклассические логики и вывод на знаниях. Формальные модели различных классов. Место онтологий в инженерии знаний. Взаимосвязи онтологического инжиниринга и семантических технологий с компьютерной лингвистикой
- Введение в инженерию знанийЧто такое “knowledge” и “linked data”. Графы как способ репрезентации информации, их проблемы и возможности. Онтологии. Знакомство с терминами, обзор на технологии
- Графы знаний в задачах цифровой гуманитаристики.Более детальное погружение в концепт “knowledge graph”. Возможности применения + практическая часть (создание графа из предложенных данных + демонстрация возможностей его использования в рамках задачи)
- Организация знаний.Онтологии vs графы знаний vs тезаурусы. Иерархия концептов внутри онтологии. Дизайн онтологий, их проблемы
- Онтологический инжиниринг: практическое применениеПостроение онтологии из заданных данных. Практическое занятие.
- Knowledge mining.Сравнение подходов и случаев использования Information Retrieval, Information Extraction и Knowledge extraction . +Практическая часть
- Базы знанийБазы знаний. Как организовать данные , извлеченные в процессе knowledge mining/ information extraction
- Knowledge + systems evaluationКак оценить извлеченную информацию и работу системы извлечения знаний
Элементы контроля
- Проект по моделированию данных в Digital HumanitiesПроект представляет собой программу, написанную индивидуально на оригинальную тему, с постановкой исследовательского вопроса и предложением его решения.
- Домашнее задание (занятие 3): построение онтологии
- Домашнее задание (занятие 5): построение графа знаний
- Домашнее задание (занятие 7): оценка работы систем
- Тест по темам курса
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.1 * Домашнее задание (занятие 3): построение онтологии + 0.1 * Домашнее задание (занятие 5): построение графа знаний + 0.1 * Домашнее задание (занятие 7): оценка работы систем + 0.4 * Проект по моделированию данных в Digital Humanities + 0.3 * Тест по темам курса
Список литературы
Рекомендуемая основная литература
- Natalya F. Noy, & Deborah L. Mcguinness. (2001). Ontology Development 101: A Guide to Creating Your First Ontology. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.B329F4D
Рекомендуемая дополнительная литература
- Gavrilova, T.A. Knowledge Engineering: learning and application guide [Электронный ресурс] / T. A. Gavrilova, S. V. Zhukova; Graduate School of Management SPbSU. — SPb.: Publishing Centre “Graduate School of Management”, 2012. — p. 133. - Режим доступа: http://znanium.com/catalog/product/492828