• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Программная инженерия»

Техники обработки естественного языка для анализа исходного кода

2023/2024
Учебный год
RUS
Обучение ведется на русском языке
10
Кредиты
Статус:
Курс по выбору
Когда читается:
4-й курс, 1-3 модуль

Преподаватели


Желтова Кристина Анатольевна

Программа дисциплины

Аннотация

Курс знакомит слушателя с современными методами обработки текстов, а также с их применением к текстам программ. Обработка текстов, как дисциплина, направлена на извлечение знаний из больших объемов текстов, а также на генерацию текстов для различных задач.
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление с историей и современным развитием области NLP.
  • Овладение методами и средствами разработки для современных задач NLP
Планируемые результаты обучения

Планируемые результаты обучения

  • Овладение методами и средствами разработки для современных задач NLP
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Вводная
  • Основы машинного обучения
  • Векторные представления слов
  • Нейронные сети
  • Обработка последовательностей
  • Языковые модели
  • Тематическое моделирование
  • Машинный перевод
  • Предобученные языковые модели
  • Современные применения
Элементы контроля

Элементы контроля

  • неблокирующий Финальный проект
    Оценка преподавателем по 6 критериям. 55 баллов за проект, полностью соответствующий критериям.
  • неблокирующий Тесты (квизы) после лекции
    4 вопроса с 3 вариантами ответа. 1 балл за правильный ответ. Всего можно получить 10*4 = 40 баллов за тесты после лекций.
  • неблокирующий Домашнее задание
    Автоматическая оценка на платформе. 12 баллов за слабое решение, 25 баллов за сильное решение. Максимум можно получить 2 * 25 = 50 баллов за оба домашних задания.
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 1 модуль
    Оценка производится в третьем модуле.
  • 2023/2024 учебный год 3 модуль
    Расчёт оценки по дисциплине производится в два этапа. На первом этапе суммируются баллы, полученные за тесты, выполшение домашних заданий, а также финальный проект. Далее производится вычисление итоговой оценки по десятибалльной шкале в зависимости от набранного балла по следующему правилу: Сумма набранных баллов -> Оценка по десятибалльной шкале (по пятибалльной шкале); 0 -> 0 (неудовлетворительно); 1 - 20 -> 1 (неудовлетворительно); 21 - 40 -> 2 (неудовлетворительно); 41 - 60 -> 3 (неудовлетворительно); 61 - 80 -> 4 (удовлетворительно); 81 - 90 -> 5 (удовлетворительно); 91 - 100 -> 6 (хорошо); 100 - 115 -> 7 (хорошо); 116 - 125 - > 8 (отлично); 126 - 135 -> 9 (отлично); 136 - 145 -> 10 (отлично).
Список литературы

Список литературы

Рекомендуемая основная литература

  • Indurkhya N., Damerau F. J. Handbook of natural language processing. – Chapman and Hall/CRC, 2010. – 704 pp.

Рекомендуемая дополнительная литература

  • Поточняк, Я. (2012). Обработка Текстов И Сообщений На Естественном Языке В Информационных Системах.