• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2020/2021

Информационные технологии. Data Culture

Статус: Курс обязательный (Химия)
Направление: 04.03.01. Химия
Кто читает: Факультет химии
Когда читается: 1-й курс, 1-4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 7

Программа дисциплины

Аннотация

Дисциплина Информационные технологии. Data Culture состоит из двух частей. Первая часть (Информационные технологии в химии) направлена на ознакомление с современными информационными технологиями, их применением для практики проведения научного исследования и анализа данных; обучение студентов самостоятельной подготовке результатов своих исследований к публикации; расширение систематических знаний по информационным технологиям и их прикладное применение; освоение практических навыков эффективной работы с массовым и научным программным обеспечением. Особое внимание уделяется рассмотрению подготовки результатов к публикации. Вторая часть курса (Data Culture) направлена на формирование знаний и навыков по современным подходам к сбору больших объемов данных, их анализу статистическими методами в применении к практическим задачам, возникающим в различных предметных областях, а также развитие у студентов понимания текущих возможностей и ограничений методов машинного обучения и искусственного интеллекта.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Информационные технологии в химии» являются: • ознакомление с современными информационными технологиями, их применением для практики проведения научного исследования и анализа данных; • обучение студентов самостоятельной подготовке результатов своих исследований к публикации; • расширение систематических знаний по информационным технологиям и их прикладное применение; • освоение практических навыков эффективной работы с массовым и научным программным обеспечением.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеть пониманием выбора подходящего инструмента для решения определенной задачи; средствами извлечения информации из различных источников; практическими инструментами для анализа данных и статистического прогнозирования на основе полученных данных;
  • Уметь самостоятельно вести поиск информации, выстроить правильную методологию проведения эксперимента по анализу данных, самостоятельно анализировать ее и делать выводы
  • Знать основные принципы работы веб-приложений, баз данных, способы статистического анализа данных, основные задачи и алгоритмы машинного обучения;
  • Уметь самостоятельно вести поиск информации, выстроить правильную методологию проведения эксперимента по анализу данных, самостоятельно анализировать ее и делать выводы;
  • 1. Владеть пониманием выбора подходящего инструмента для решения определенной задачи; средствами извлечения информации из различных источников; практическими инструментами для анализа данных и статистического прогнозирования на основе полученных данных;
  • 1. Знать основные принципы работы веб-приложений, баз данных, способы статистического анализа данных, основные задачи и алгоритмы машинного обучения;
  • Умеет: • Применять базовые принципы молекулярной механики для расчетов геометрии и энергетических параметров молекул. • Показывает: наличие базовых навыков работы в физико-химических вычислительных системах, методах расчета энергии связывания лиганд-мишень.
  • Умеет: • подготавливать графические файлы в зависимости от их назначения; • оформлять химические тексты любой категории сложности на основе современных стандартов
  • Умеет: • использовать вспомогательные программы: утилиты, архиваторы, антивирусное ПО; • производить необходимые расчеты в электронных таблицах, строить диаграммы и графики; • создавать презентации в среде PowerPoint; • самостоятельно разрабатывать Web-страницы.
  • Демонстрирует знание базовых принципов применения вычислительной техники и программного обеспечения (ПО) в химии.
  • Демонстрирует знание текстовых редакторов, электронных таблиц и систем подготовки презентаций в химии.
  • Умеет: • использовать графический интерфейс, проводить настройку ОС Windows; • подбирать и конфигурировать аппаратное обеспечение современного компьютера в зависимости от поставленной задачи; • анализировать строение и назначение локальных сетей и Интернета.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Аппаратное обеспечение и ОС, тенденции развития. Компьютерные сети, файлы. Возможности компьютерной сети: локальной и глобальной. Интернет и безопасность, защита данных. Операции с файлами. Использование графического интерфейса ОС.
    1.1. История развития компьютеров. Назначение компьютеров. Компоненты компьютера (устройства ввода, вывода, системный блок). Основные компоненты системного блока (материнская плата, процессор, оперативная память, видеокарта, жесткий диск, охлаждение устройств; устройства ввода-вывода: модем, сетевой адаптер) и их разновидности. Носители информации. Понятия команды, программы, выполнение программы процессором. Представление данных в компьютере. Периферийное оборудование (принтеры, сканеры) и их разновидности. Способы подключения внешних устройств (LPT, COM, USB, FireWire, BlueTooth). Модернизация. 1.2. Операционные системы. Назначение ОС. Современные ОС и их краткая сравнительная характеристика (ОС семейства Windows, ОС семейства UNIX, MacOS). Установка и обслуживание Windows. Файловые системы (древовидные) на примере FAT/NTFS. Логические диски. Каталоги. Имя файла. Расширение. Путь к файлу. Файловые утилиты, программы обслуживания жесткого диска. 1.3. Введение в компьютерные сети. Глобальные, региональные и локальные сети. Адресация, настройки, проблемы, перспективы. Работа в локальной сети. Назначение компьютерных сетей. Одноранговые сети и сети с выделенным сервером. Протоколы. Стек протоколов TCP-IP, назначение IP в глобальной и локальной сети, DHCP. Конфигурация и настройка сети в ОС Windows. Сетевые диски. Работа в сети с помощью проводника Windows. Утилиты работы в сети: ping, tracert, ftp, telnet, ssh, nslookup, ipconfig - краткий обзор. Беспроводные сети, защита. 1.4. Глобальные сети, структура. Интернет. URL. Обзор основных сервисов, предоставляемых Интернетом и программ для работы с ними: e-mail (Microsoft Outlook, TheBat), WWW (Browser), Ftp (ftp-клиенты). Подключение к Интернету (DialUp, DSL, LAN). Поиск информации в Интернете: подходы, основные поисковые машины, порталы, расширенный научный поиск. 1.5. Компьютерная безопасность Вирусы, трояны и spyware — классификация и характеристика. Способы заражения. Возможные последствия. Меры предосторожности. Защита от вирусов. Антивирусы и брандмауэры, защита от спама. Резервное копирование данных. 1.6. Графический интерфейс MS Windows. Структура и настройка Windows. Особенности и основные элементы графического интерфейса пользователя MS Windows (окна, меню, панель задач, меню «Пуск», рабочий стол, пиктограммы и их свойства). Работа с использованием клавиатуры и мыши, основные клавиатурные комбинации. Проводник Windows – работа с файлами. Сторонние системы управления файлами, Total Commander. Установка и удаление шрифтов, принтеров, программ, устройств; клавиатура, настройка языков, локализации, даты/времени. Интерфейс командной строки (cmd.exe), его особенности. Пакетные файлы (без команд организации циклов). Консольные команды.
  • Основные возможности Windows, встроенное программное обеспечение. Прикладное программное обеспечение: текстовые, табличные, web-редакторы, презентационное ПО, работа с источниками информации в химии. Специальное программное обеспечение для работы в химии.
    2.1. Пользовательский интерфейс ОС. Варианты загрузки Windows. Настройка и оптимизация системы. Оптимизация размещения пользовательских файлов. 2.2. Сжатие и архивация данных. Принципы работы архиваторов. Сжатие текста, графики и мультимедиа-информации, с потерей и без потери качества. 2.3. Прикладные программы: обзор ПО. Классификация и назначение прикладных программ. Встроенные Windows-приложения. MSOffice. Текстовые редакторы. Назначение текстовых редакторов. MSWord и альтернативы. Настройки. Создание/загрузка/сохранение документов в различных форматах. Перемещение по документу, виды отображения. Оформление текста без использования стилей (шрифты, абзацы). Поиск/замена текста. Оформление с использованием стилей. Создание/изме¬нение/удаление стилей. Специальное форматирование: страница, табуляция и табличный редактор, списки, колонтитулы, разбиение текста на колонки. Математические формулы. Иллюстрации: импорт и размещение. Средства автоматизации: автоматическая генерация содержаний, указателей, списков (иллюстраций, подписей, ссылок на подписи), поля (fields), сортировка. Шаблоны. Проверка правописания. Вывод на печать и в файл. 2.4. Синтаксис и структура HTML. Обзор визуальных HTML редакторов. Редактирование HTML напрямую и в визуальном HTML–редакторе. Простое оформление текста и гиперссылок. Принципы Web-дизайна. 2.5. Использование электронных таблиц MS Excel. Назначение электронных таблиц. Создание/загрузка/сохранение таблиц в различных форматах. Добавление и удаление листов из рабочей книги. Форматирование и автоформатирование таблиц. Построение диаграмм. Расчеты в таблицах. Фильтрование. Шаблоны. Построение графиков в Excel. Знакомство с Origin: построение графиков и их обработка. 2.6. Подготовка презентаций MS PowerPoint. Принципы построения лекционного материала, тайминг. Оформление слайда, текст, анимация. Онлайн-системы подготовки презентаций. Prezi.com. 2.7. Работа с источниками информации в химии. Первичные и вторичные источники научно-технической информации (НТИ). Журналы как первоисточники — печатные и электронные. Что такое импакт-фактор журнала (версии WebОfScience и Scopus), его расчет. Понятие и реализация DOI-индекса публикации. Научная электронная библиотека (www.elibrary.ru). Возможности полнотекстового поиска. Поиск по специальным полям — ISSN. DOI/Crossref. Поиск с использованием Google Scholar (http://scholar.google.com/). Поиск конкретных работ (статей из научных журналов) с использованием системы CrossRef (DOI), Web Of Science, Scopus. Синтаксис, фильтрация и сортировка полученной информации. База данных REAXYS. Функция анализа (по авторам, названиям организаций, наименованиям журналов, году публикации и т.д.) Функция анализа для результатов поиска по веществу или реакции. Сортировка ответов (по цитированию, по дате и др.) Вторичная научно-техническая информация. Производители НТИ и вендоры. Классификация баз данных — библиографические, структурно-химические, фактографические, полнотекстовые. Библиографические БД. STN International как крупнейший источник библиографических баз данных по научно-техническим дисциплинам (www.cas.org). Дополнительная возможность — поиск по цитированию — БД CA, CAPlus, SCOPUS. 2.8. Распознавание текста OCR. Принцип распознавания. Автораспознавание текстов на иностранном языке; распознавание документов с низким качеством изображения, приведение к виду, позволяющему облегчить распознавание; обучение программы. 2.9. PDF-файлы Особенности PDF-файлов. Создание PDF-файлов, постформатирование, включение дополнительных интерактивных элементов, редактирование имеющихся, в т.ч. с нестандартной кодировкой и шрифтами.
  • Графика. Растровая и векторная графика, особенности научной графики. Химическая графика. Расчеты геометрии структур.
    3.1. Общие вопросы работы с графикой. Растровая и векторная графика. Форматы графических файлов и их особенности (TIFF, JPEG, BMP, GIF, PNG, PCX, EPS), программные форматы, язык PostScript, компрессия графических файлов. Совмещение графики и текста в различных редакторах. Источники компьютерных изображений (сканирование, цифровые снимки, библиотеки изображений, Интернет, рисование, специализированные программы, научные приборы). Зависимость параметров графических файлов от их назначения. Обзор основных графических программ. 3.2. Векторная графика Назначение. Недостатки и достоинства. Особенности рисования и редактирования, основные графические инструменты. Кривые Безье. Выделение, преобразование и упорядочивание объектов. Шрифт Windows как простейший пример векторной графики. Создание и редактирование шрифтов. 3.3. Растровая графика Назначение. Недостатки и достоинства. Классификация. Разрешение в зависимости от назначения, особенности масштабирования. Цифровая фотография, сканирование. Основные приемы редактирования растровых изображений. 3.4. Научная и деловая графика Основные виды диаграмм, значение в научном исследовании. Подготовка исходных данных, их дополнительная математическая обработка. Принципы оформления, наглядность, типовые ошибки. Оси, засечки, сетка, подписи, размерности, шкалы, легенда, объединение данных. 4.5. Химическая графика Основные химические графические примитивы и особенности их использования. Типовые ошибки при наборе. Рисование кривых, кривая Безье в химических структурах, карандаш. Группировка и упорядочивание объектов. Особенности набора формул для химической базы данных. Стилевое оформление. Способы оптимизации набора химических структур. Встроенные шаблоны и заготовки для форматирования химической графики в системе ChemDraw. Использование текста в химических уравнениях, набор специальных символов. Перенос в программы редактирования текста и презентаций.
  • Вычислительные методы и математическое моделирование в химии
    4.1. Вычислительные методы в химии. История развития вычислительных методов. Теоретические основы полуэмпирических и неэмпирических расчётных методов. Понятие функционала плотности. Понятие базиса. Математическое моделирование в химии. Визуализация моделей химических объектов на молекулярном уровне. Трехмерная графика. Компьютерное моделирование геометрических и энергетических параметров молекул. 4.2. Молекулярная механика: теоретические основы, возможности метода и основные трудности. Принципы молекулярных расчетов. Расчетные программы на основе молекулярной механики. Молекулярная динамика. Общее представление о полуэмпирических и неэмпирических методах квантовой химии. 4.3. Оптимизация геометрии молекул полуэмпирическими и неэмпирическими методами. Границы области применение различных методов квантовохимических расчётов. Исследование механизмов химических реакций. Поиск переходного состояния методами квадратичного транзита. Использование процедуры сканирования (SCAN) поверхности потенциальной энергии при изучении механизмов химических реакций. 4.4. Соотношения «структура-свойство». Базовые понятия, моделирование структур для направленного синтеза биологически активных соединений. Моделирование каталитических процессов (включая биокатализ).
  • Web - технологии
    • Обзор web, db & ml и их связи между собой • HTML, клиент-сервис • Примеры БД и предназначение (связь с web) • ML, для чего, как связан с БД и MLPersonal home page, примеры• Интернет, история развития • HTML/CSS • Клиент-сервер, фронтэнд-бэкенд • Деплой, облака и хостинг• Примеры • Взаимодействие клиент-сервер, как все работает • Локальный запуск и измененияСтруктуры данных - json, csv, xml • Связь WEB-приложения и БД, ввод/вывод информации• Структуры данных • Csv • Xml • Json
  • Глубокое обучение
    • Компьютерное зрение • NLP
  • Статистика
    Введение, матаппарат • Выборка, совокупность, признаки • Среднее, мода, медиана • Распределения, дисперсия Практика, решение задач• Доверительные интервалы • Нулевая и альтернативная гипотезы • Ошибки первого/второго рода • Коэффициент корреляции• Практика, решение задач• Применение статистических функций в запросах к БД
  • Машинное обучение
    Введение, примеры • Области применения • Декомпозиция составляющих• Регрессионный анализ • Кластерный анализ • Классификация• Azure ML Studio • Разбор полного примера• Azure ML Studio • Сбор данных • Выбор задач для проекта• Azure ML Studio • Финальный проект
  • Базы данных
    • Термины и определения БД • Проектирование баз данных. Модель «сущность –связь». • Реляционная алгебра. Нормализация реляционных отношений.• Теоретические основы • История развития• Примеры • Реляционные • No-sql• Основные объекты базы и их описание на языке SQL. • Запросы на языке SQL. • Big Data. Направления и тенденции развития баз данных.• Доступы • Примеры записи/чтение данных• SQL-запросы • SELECT • LIMIT • JOIN• SQL-запросы • GROUP BY • WINDOW-functions• БД Reaxys • Область применения • Примеры запросов
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
    Семь домашних заданий в течение 1-3 модуля с равным весовым коэффициентом.
  • блокирует часть оценки/расчета Письменные контрольные работы
  • неблокирующий Экзамен 3 модуль
  • неблокирующий Самостоятельная работа 1
  • неблокирующий Самостоятельная работа 2
  • неблокирующий Самостоятельная работа 3
  • блокирует часть оценки/расчета Индивидуальный проект
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    0.5 * Домашние задания + 0.3 * Письменные контрольные работы + 0.2 * Экзамен 3 модуль
  • Промежуточная аттестация (4 модуль)
    0.075 * Индивидуальный проект + 0.7 * Промежуточная аттестация (3 модуль) + 0.075 * Самостоятельная работа 1 + 0.075 * Самостоятельная работа 2 + 0.075 * Самостоятельная работа 3
Список литературы

Список литературы

Рекомендуемая основная литература

  • Работа с электронными таблицами. Microsoft Office Excel 2003, Калугина О. Б., Люцарев В. С., 2009

Рекомендуемая дополнительная литература

  • Введение в хемоинформатику. Ч . 5: Информатика химических реакций, Баскин, И. И., 2017
  • Введение в хемоинформатику. Ч. 1: Компьютерное представление химических структур, Маджидов, Т. И., 2013
  • Введение в хемоинформатику. Ч. 2: Химические базы данных, Маджидов, Т. И., 2015
  • Введение в хемоинформатику. Ч. 4: Методы машинного обучения, Баскин, И. И., 2016
  • Введение в хемоинформатику. Ч. 6: Химическое пространство и виртуальный скрининг, Маджидов, Т. И., 2019
  • Введение в хемоинформатику. Ч.3: Моделирование "структура - свойство", Баскин, И. И., 2015