Рыжиков Артём Сергеевич
- Младший научный сотрудник: Факультет компьютерных наук / Институт искусственного интеллекта и цифровых наук / Научно-учебная лаборатория методов анализа больших данных
- Преподаватель: Факультет компьютерных наук / Департамент больших данных и информационного поиска
- Начал работать в НИУ ВШЭ в 2017 году.
Oбразование
Достижения и поощрения
- Благодарственное письмо проректора НИУ ВШЭ (сентябрь 2022)
Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022)
Надбавка за регулярные публикации в международных рецензируемых научных изданиях (2024–2029)
Учебные курсы (2023/2024 уч. год)
- Генеративные модели в машинном обучении (Бакалавриат; где читается: Факультет компьютерных наук; 4-й курс, 3 модуль)рус
- Генеративные модели в машинном обучении (углубленный курс) (Бакалавриат; где читается: Факультет компьютерных наук; 3-й курс, 3, 4 модуль)рус
- Машинное обучение (Дисциплина общефакультетского пула; 3, 4 модуль)рус
- Архив учебных курсов
Учебные курсы (2022/2023 уч. год)
- Генеративные модели в машинном обучении (Бакалавриат; где читается: Факультет компьютерных наук; 4-й курс, 3 модуль)рус
- Генеративные модели в машинном обучении (Магистратура; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук направление: 01.04.02. Прикладная математика и информатика, направление: 01.04.02. Прикладная математика и информатика; 2-й курс, 3 модуль)рус
Учебные курсы (2021/2022 уч. год)
- Генеративные модели в машинном обучении (Бакалавриат; где читается: Факультет компьютерных наук; 4-й курс, 3 модуль)рус
Учебные курсы (2020/2021 уч. год)
- Introduction to Deep Learning (Бакалавриат; где читается: Факультет компьютерных наук; 3-й курс, 1-3 модуль)Анг
- Генеративные модели в машинном обучении (Бакалавриат; где читается: Факультет компьютерных наук; 4-й курс, 3 модуль)рус
Диссертация на соискание учёной степени кандидата наук
- 2024
Рыжиков А. С. Глубокие порождающие модели для поиска аномалий
Конференции
Авторские права и патенты
№ п/п | Номер РИД | Вид РИД | Наименование РИД | Сведения о регистрации | Авторы |
---|---|---|---|---|---|
1 | 5.0008-2024 | Программа для ЭВМ | Библиотека классификации состояний промышленных электродвигателей методами ИИ по токовому сигналу | 2024663151 | Али Сараа, Рыжиков Артём Сергеевич, Деркач Денис Александрович, Красноженов Григорий Григорьевич |
2 | 8.0087-2021 | Произведение | МООК "Deep Generative Models" | Рамазян Тигран Арменович, Устюжанин Андрей Евгеньевич, Деркач Денис Александрович, Рыжиков Артём Сергеевич, Гарин Владимир Юрьевич |
Опыт работы
Рыжиков Артём Сергеевич
О себе
Закончил бакалавриат кафедры Физики Элементарных Частиц Физического факультета Новосибирского Государственного Университета. Занимался физикой высоких энергий в Институте Ядерной Физики им. Будкера. В свободное время занимался космологией, теоретической физикой, топологией и дифференциальной геометрией.
C 2015 года занимаюсь анализом больших данных и машинном обучением. Большой опыт участия в различных Data Science, Big Data и HighLoad – проектах. Выпускник ШАД. Сейчас занимаюсь исследованиями по применению машинного обучения в физике высоких энергий. С июля 2017 года являюсь действующим сотрудником (стажер-исследователь) лаборатории анализа больших данных НИУ ВШЭ.
Веду лекции по курсу “Искусственный интеллект и большие данные” в рамках программы Data Culture НИУ ВШЭ. Ранее вёл семинары по курсу “Современные методы машинного обучения” НИУ ВШЭ.
Область интересов
- Физика Высоких Энергий
- Машинное обучение
- Обучение с подкреплением
- Байесовские методы машинного обучения
- Глубинное обучение
- Этическое машинное обучение
Компетенции
- Programming (Python/Scala/Java)
- Big Data - ETL (Elastic Search/Solr), Spark, DataStax Enterprise, Hive, NoSQL (Cassandra/DynamoDB), AWS (DynamoDB/SQS/SNS/S3)
- Machine Learning - Supervised/Unsupervised Learning, Deep Learning, Reinforcement learning, Bayes ML, Ethic ML
- SQL/Queues - PostgreSQL, Redis, RabbitMQ
- Others – Docker (+Rancher), Telegram Bots
Научные достижения
В рамках своей курсовой работы 1 курса магистерской программы ФКН ВШЭ успешно реализовал нейросеть, способную обучаться на Монте-Карло событиях без переобучения, давая сравнимое качество классификации на реальных событиях. Данная работа имеет огромную важность для применения глубинного машинного обучения к идентификации элементарных частиц в физике высоких энергий. С этой работой мы успешно выступили на международной конференции ACAT 2017 и на данный момент публикуем статью, посвященную данному методу.
В рамках своей дипломной магистерской работы успешно реализовал глубинную нейросеть с плоским профилем эффективности. Работа проводилась в рамках гранта РНФ (см. ниже). Полученные в ходе исследования результаты позволили обучать модели глубинного обучения, одинаково хорошо работающие в разных регионах значений интересующих нас переменных. Такие модели машинного обучения представляют огромный интерес в физике высоких энергий, в частности в идентификации элементарных частиц. Ранее никому не удавалось обучать нейросети с таким свойством. По данной работе также планируется публикация и доклад.
Гранты
Организация РНФ
Программа «Проведение исследований научными группами под руководством молодых ученых»
Название “Поиск новой физики в данных LHCb с применением методов глубокого обучения”
Номер 17-72-20127
Публикации
- Ustyuzhanin A., Рыжиков А. С. Кросс-доменная адаптация с помощью нейронных сетей на прямом распространении ошибки // ACAT Proceedings 2017, USA. 2017 (в печати)
Конференции
- Ustyuzhanin A., Рыжиков А. С. Кросс-доменная адаптация с помощью нейронных сетей на прямом распространении ошибки // ACAT 2017, USA. 2017
Преподавание
- Семинары, майнор Современные методы машинного обучения, НИУ ВШЭ (Высшая Школа Экономики), 2017
- Лекции, Искусственный интеллект и большие данные, Data Culture, НИУ ВШЭ, 2018
Образование
Новосибирская Физико-Математическая Школа (СУНЦ НГУ)
Год выпуска: 2011
Средний балл: 4.9
Достижения:
• Многократный призёр Всесибирской олимпиады школьников по Физике (2009-2011)
• Многократный призёр Всесибирской олимпиады школьников по Математике (2009-2010)
• Победитель Всесибирской олимпиады школьников по Физике (2009, 2011)
• Победитель регионального этапа Всероссийской олимпиады школьников по Физике (2011)
Новосибирский Государственный Университет (НИУ НГУ)
Форма обучения: дневная, очная
Степень: Бакалавр
Год выпуска: 2015
Факультет: Физический
Направление: Кафедра Физики Элементарных Частиц
Средний балл: 4.5
Выпускной диплом: Калибровка калориметров на основе тяжелых кристаллов (NaI, BGO) по краю спектра однократного тормозного и Комптоновского излучений с использованием генератора Монте-Карло
Достижения:
• Победитель Всероссийской студенческой олимпиады по математике ("Магистратура МФТИ", МФТИ, 2015, 1-е абсолютное место)
• Призёр Всероссийской студенческой олимпиады по физике ("Магистратура МФТИ", МФТИ, 2015)
• Победитель Новосибирской региональной студенческой олимпиады по теоретической и прикладной механике (2014)
• Многократный победитель студенческой олимпиады НГУ по теоретической и прикладной механике (2014-2015)
Высшая Школа Экономики (НИУ ВШЭ)
Форма обучения: дневная, очная
Степень: Магистр
Дата окончания: 2018
Факультет: Computer Science
Направление: Data Science
Graduating diploma: Обучение нейросетей с равномерным профилем эффективности для детектирования элементарных частиц
Дополнительные курсы
ШАД (Школа Анализа Данных, Яндекс)
Форма образования: очная, Новосибирский филиал
Дата окончания: 2017
Направление: Computer Science
Курсы:
• Algorithms and Data Structures of Search 1, 2
• Discrete Math and Statistics
• C++
• Parallel and Distributed Calculations
• Python
• Machine Learning 1, 2
• Deep learning
• Reinforcement learning
• Bayes machine learning
Языки
• Русский (Native)
• English (Upper-Intermediate). Fluent reading and writing
Опыт работы
Организация LAMBDA (лаборатория анализа больших данных НИУ ВШЭ)
Позиция: стажер-исследователь
Период: 15.07.2017-н.в.
Обязанности:
- Тестирование и формулирование гипотез
- Изучение статей по современным исследованиям в области ML
- Применение современных методов машинного обучения
Задачи:
- Исследование современных методов в применении к идентификации частиц в физике высоких энергий
- Обучение и тестирование архитектур нейросетей с кросс-доменной адаптацией, инвариантных относительно Монте-Карло данных
- Обучение и тестирование архитектур
Используемые технологии:
- Deep Learning – Keras, Tensorflow, Lasagne
- Machine Learning - SkLearn
- Programming - Python
Достижения и опыт:
- Удалось без значимой потери качества обучить нейросеть. Это позволило обучать нейросети, одинаково работающие при детектировании Монте-Карло и реальных событий
- Удалось обучить нейросеть с инвариантным по задаваемым переменным качеством. Это позволило обучать нейросети для распознавания событий с одинаковой эффективностью вдоль импульса частицы
Организация Teleport
Позиция: Machine Learning Expert / Senior Data Scientist
Период: 29.02.2017-31.08.2017
Обязанности:
- Тестирование и формулирование гипотез
- Обучение глубинных нейросетей
- Изучение статей по современным исследованиям в области Deep Learning (Image Segmentation) и Computer Vision, их реализация и тестирование
Задачи:
- Исследование современных подходов в компьютерном зрении и глубинном обучении
- Сегментация фото и видео
- Edge detection
- Постпроцессинг
- Участие в реализации закрытого фреймворка для глубинного обучения, основанного на Tensorflow
Используемые технологии:
- Deep Learning - Tensorflow
- Computer vision - OpenCV
- Programming – Python, С++
Достижения и опыт:
- За короткие сроки разобрался в современных методах применения глубинного обучения к задачам компьютерного зрения
- Внёс значимый вклад в виде эффективного высокопроизводительного постпроцессинга сегментированных изображений (IoU увеличился на 3%, улучшилось визуальное качество)
- Реализовал эффективную и быструю архитектуру нейросети для сегментации видео
- Получил очень хороший опыт работы с глубинным обучением на Tensorflow
Организация Double Data
Позиция: Full-Stack Data Scientist/Scala Developer
Период: 01.05.2016-15.02.2017
Обязанности:
- Тестирование и формулирование гипотез
- Обучение, тестирование и деплой ML-моделей
- Написание кода
- Обработка больших данных
Задачи:
- Реализация закрытого инструмента для поиска людей в социальных сетях
- Тестирование гипотез и построение ML-моделей (pointwise-) ранжирования
- Построение Data Lake – витрины данных
- Обработка больших (200 Тб) данных на Spark. Оптимизация Spark-джоб
- Анализ социальных графов (> 1Тб) на Spark
- Написание и тестирование кода для поискового движка
- Разведочных анализ данных
- Построение моделей кредитного скоринга
Используемые технологии:
- Machine Learning – t-SNE, SkLearn, XGBoost
- Python – Flask, PySpark, PyTest
- Scala – Akka, Akka Http, JUnit, Mockito
- Big Data – Spark, ElasticSearch ETL
Достижения и опыт:
- В команде из 4 человек за 3 месяца с нуля реализовали поисковый движок, позволивший находить 60% (Recall) заёмщиков с 5% (1 – Precision) ошибкой
- Получил опыт обработки реально больших (>200 Тб) данных на Apache Spark. Научился эффективно оптимизировать Spark-джобы
- В хорошей степени овладел навыками анализа данных и визуализации на Python
- Очень много попрактиковал TDD-подход к написанию HighLoad-кода
Организация SurfingBird
Позиция: Full-Stack Data Scientist/Scala Developer
Период: 19.10.2015-29.04.2016
Обязанности:
- Тестирование и формулирование гипотез
- Написание кода
- Обработка больших данных
Задачи:
- Разработка, оптимизация и поддержка архитектуры рекомендательного движка
- Разработка, мониторинг и поддержка рекомендательных алгоритмов
- Сегментация пользователей (в т.ч. Realtime)
- Выделение ядра пользователей
Используемые технологии:
- Machine Learning – Topic Modeling, Sentiment Analysis, Recommendations, Clustering, SVD, PLSA, LDA
- Programming – Python, Scala, Java, SQL, PostgreSQL, Redis, RabbitMQ
- Big Data – Spark, SparkML, ElasticSearch ETL, Solr ETL, Cassandra, DataStax Enterprise
Достижения и опыт:
• Разработал и внедрил в production очень эффективный алгоритм стриминговой сегментации пользователей. Впоследствии это позволило решить проблему холодного старта для площадок с очень разреженным трафиком. Такая сегментация пользователей по контенту давала CTR, отличающийся на 0.09% от стандартных алгоритмов коллаборативной фильтрации. Это очень хороший результат для латентных моделей рекомендательных систем
• Очень эффективно оптимизировал некоторые алгоритмы рекомендательной системы на Spark. В некоторых случаях это ускорило время расчёта алгоритмов в 5 (!) раз. Как следствие, очень большой прирост CTR
• Проделал очень большой рефакторинг legacy-кода (порядка 4к строк Scala-кода)
• Разработал новые, очень эффективные, рекомендательные алгоритмы (Включая модели sentiment analysis и topics modeling)
• Оптимизировал запросы в ElasticSearch. На некоторых очень крупных рекомендательных площадках это дало относительный прирост CTR на 45% (!)
• Научился применять Spark для аналитики и агрегации больших данных
• Написал алгоритм предсказания популярности страниц по репостам в соцсетях
• Написал распределённую систему для онлайнового пересчёта рекомендаций
• Сделал очень много различных отчётов с использованием Python, Spark и SQL
Информация*
- Общий стаж: 10 лет
Три сотрудника лаборатории стали лауреатами стипендии имени Ильи Сегаловича 2020
13 апреля состоялась трансляция, на которой были оглашены лауреаты стипендии имени Ильи Сегаловича на 2020 год.
Первый семинар на Покровке
Лаборатория методов анализа больших данных переехала в новый кампус ВШЭ по адресу Покровский бульвар, д 11, строение 4