Прикладная статистика и науки о данных
На рынке труда сейчас существует множество вакансий в сфере наук о данных. С экспоненциальным ростом объема информации специалисты в области анализа данных становятся незаменимыми для компаний всех отраслей. В грядущие годы сфера наук о данных получит динамичное развитие, и поиск интересных проектов и работы станет конкурентным, а работодатели – более требовательными к компетенциям претендентов.
Основой современного анализа данных является прикладная статистика. Прикладная статистика позволяет применять продвинутые методы математической статистики и обрабатывать статистические данные для анализа различных сфер жизни общества с помощью компьютерной обработки данных. Технические знания и навыки, которые усиливают это направление, дают Науки о данных (Data Science), как область, которая объединяет разделы компьютерных наук, связанных с данными: сбором, обработкой, анализом и принятием эффективных решений. Объединение двух направлений позволяет проводить анализ больших объемов неструктурированных данных – той комплексной информации о современном обществе, которая становится доступна исследователю благодаря новым информационным технологиям. Именно поэтому наш трек называется «Прикладная статистика и науки о данных».
«В первую очередь, работа специалистов по анализу данных заключается в совершении открытий, буквально утопая в данных. Это их предпочтительный метод навигации в окружающем мире. Уверенно чувствуя себя в цифровом пространстве, они способны структурировать большие объемы бесформенных данных и сделать возможным их анализ. Они выявляют богатые источники данных, объединяют их с другими, потенциально неполными источниками данных и очищают полученный набор. В условиях жесткой конкуренции, где постоянно меняются задачи и поток данных не прекращается, специалисты по анализу данных помогают лицам, принимающим решения, перейти от ситуативного анализа к непрерывному диалогу с данными.Специалисты, работающие с данными, находятся в постоянном поиске новых решений и гипотез для бизнеса. От аналитиков данных требуется не только навыки системного представления данных, но и творческий подход к визуальному отображению информации, желание и готовность заглянуть вглубь проблемы, найти вопросы, лежащие в ее основе, и сформулировать их в доступный проверке набор гипотез. Важно помнить, что анализ данных — это в первую очередь про исследования. Исследовать данные можно на разных уровнях: автоматизировать процесс анализа, формулировать множество гипотез и тестировать их с помощью различных методов. Аналитики данных в современном бизнесе помогают анализировать основные метрики, решать операционные задачи и достигать стратегических целей.
Что за человек всем этим занимается? Какие качества делают специалиста по анализу данных успешным? Представьте его или её как гибрид специалиста по анализу данных, аналитика, коммуникатора и доверенного советника. Такое сочетание невероятно мощное — и редкое.
Если под словом «привлекательный» подразумевается наличие редких, востребованных качеств, то специалисты по анализу данных уже обладают ими. Нанять их сложно и дорого, а учитывая высокую конкуренцию на рынке их услуг, удержать их тоже непросто. Просто не так много людей, сочетающих в себе научное образование и вычислительные и аналитические навыки».
Davenport Thomas H., Patil DJ Data Scientist: The Sexiest Job of the 21st Century. Meet the people who can coax treasure out of messy, unstructured data // Harvard Business Review — October, 2012. (Дэвенпорт Томас Х., Патил Ди Джей. Специалист по анализу данных: самая привлекательная профессия XXI века. Познакомьтесь с людьми, которые могут извлечь сокровища из неструктурированных данных // Harvard Business Review — октябрь 2012 г.)
Аналитик данных должен понимать тенденции развития искусственного интеллекта (включая генеративный ИИ), паттерны и стратегии аналитики данных, а также не только уметь программировать, но и глубоко понимать создаваемый продукт, а также хорошо ориентироваться в статистике. В 2012 году Томас Х. Давенпорт с коллегами опубликовали статью «Специалист по анализу данных: самая привлекательная профессия XXI века», а в 2022 – ее продолжение под названием «Остается ли профессия специалиста по анализу данных самой привлекательной в XXI веке?», в котором отмечали, что важно не только уметь строить модели, но и загружать в них нужные данные, а также управлять работой систем, исходя из тех целей, которые ставит бизнес.
У компаний и организаций любого размера в разных отраслях экономики есть запрос на специалистов, которые смогут управлять потоками данных и находить в них ценную информацию. Специалисты этой сферы должны хорошо знать статистику и обладать знаниями в соответствующей предметной области. Знание статистических методов усиливается навыками из компьютерных наук.
Запрос на специалистов в области анализа данных актуален не только для компаний, но и естественным образом вписан в национальную стратегическую повестку технологического развития (национальные проекты «Экономика данных» и «Искусственный интеллект»). В частности, именно национальный проект «Экономика данных» подтверждает и актуализирует запрос на специалистов в области статистики и анализа данных. Важно иметь возможность планировать развитие экономики отдельных отраслей, регионов и городов, а также эффективно и проактивно выстраивать работу любой организации для максимально быстрого получения результата.
«Эти изменения означают, что программирование, которое, возможно, было самым распространенным требованием к кандидатам на работу десять лет назад, стало несколько менее важным в области анализа данных. Оно перешло в другие профессии или все чаще автоматизируется. (Однако заметное исключение из этой тенденции — очистка данных.) Ключевой фокус работы продолжает смещаться в сторону предиктивного моделирования и способности преобразовывать бизнес-задачи и требования в модели. Это совместная работа, но, к сожалению, пока нет эффективных инструментов для структурирования и поддержки совместной работы в области анализа данных.».Основные составляющие для трека «Прикладная статистика и науки о данных» — это обучение работе с данными и изучение продвинутых статистических методов. Важно понимать, как извлекать информацию из разных источников, а также как в дальнейшем работать с этой информацией, получая статистически точные и достоверные результаты, которые можно использовать при принятии решений в бизнесе. Изучение разнообразных продвинутых статистических методов анализа данных (современные методы анализа данных, байесовская статистика, стохастические модели, временные ряды, сетевой анализ и многих других) и компьютерными методами обработки и анализа данных (интеллектуальный анализ данных, машинное обучение, программирование в R и Python, анализ неструктурированных данных и др.) будет завершаться выполнением прикладных проектов. Владея современными методами анализа данных, можно решать задачи максимально эффективным путём, обрабатывая массивы данных в программных продуктах, которые требуют различного уровня участия пользователя. Студенты программы познакомятся с программами, пакетами и базами для полного цикла работы с данными: R, Python, SAS, STATA, Orange, Pajek, Gephi, и другие. Студенты научатся работать с алгоритмами, способными получать, обрабатывать данные, просчитывать и принимать решения. Знание математической статистики, навыки проверки гипотез и оценки неизвестных параметров дополняются глубоким пониманием того, как проводятся актуальные исследования в бизнесе, в т. ч. с применением технологий искусственного интеллекта.
Davenport Thomas H., Patil DJ Is Data Scientist Still the Sexiest Job of the 21st Century? // Harvard Business Review – July 15, 2022. (Дэвенпорт Томас Х., Патил Д.Дж.: Является ли профессия специалиста по анализу данных по-прежнему самой привлекательной профессией XXI века? // Harvard Business Review – 15 июля 2022 г.)
Трек «Прикладная статистика и науки о данных» подойдет студентам, желающим развиваться в области анализа данных – актуального и востребованного направления в любой предметной области. Базовое образование может быть любым: трек будет интересен студентам как с образованием в области социальных наук, так и с образованием в области точных наук. С одной стороны студенты на треке смогут систематизировать и углубить свои знания в области социальных наук, а с другой – освоить навыки исследования данных, чтобы выполнять задачи аналитики данных и эффективнее руководить командами специалистов по анализу данных.
Обучение на этом треке позволит студентам приобрести нужные знания и навыки для трудоустройства в различных компаниях и корпорациях. Выпускники трека «Прикладная статистика и науки о данных» могут работать как аналитики данных или продуктовые аналитики в разных сферах, решая как исследовательские задачи, так и прикладные задачи по управлению продуктами и процессами в рамках своих организаций. При желании выпускники трека смогут продолжить работу и в академической среде, поступив в аспирантуру.
