• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Владение языками
английский
Контакты
Телефон:
22051
Электронная почта:
Адрес: АУК "Покровский бульвар", Покровский б-р, д.11, каб. S924
Время работы: 9:00-18:00
Расписание
ORCID: 0000-0002-3543-0313
ResearcherID: X-1609-2019
Google Scholar
Блоги и соц. сети
LinkedIn
Руководитель
Устюжанин А. Е.
Версия для печати

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

Рыжиков Артём Сергеевич

  • Начал работать в НИУ ВШЭ в 2017 году.

Полномочия / обязанности

Аналитик

Образование

2015

Бакалавриат: Новосибирский национальный исследовательский государственный университет, специальность «Физика»

Обучение в аспирантуре

1-й год обучения
Утвержденная тема диссертации: Глубокие порождающие модели для поиска аномалий
Научный руководитель: Деркач Денис Александрович

Учебные курсы (2019/2020 уч. год)

Учебные курсы (2017/2018 уч. год)

Публикации2

Конференции

2017

ACAT 2017 (Seattle). Доклад: Domain adaptation with gradient reversal for MC/real data calibration


Опыт работы

Рыжиков Артём Сергеевич

 

О себе

            Закончил бакалавриат кафедры Физики Элементарных Частиц Физического факультета Новосибирского Государственного Университета. Занимался физикой высоких энергий в Институте Ядерной Физики им. Будкера. В свободное время занимался космологией, теоретической физикой, топологией и дифференциальной геометрией.

            C 2015 года занимаюсь анализом больших данных и машинном обучением. Большой опыт участия в различных Data Science, Big Data и HighLoad – проектах. Выпускник ШАД. Сейчас занимаюсь исследованиями по применению машинного обучения в физике высоких энергий. С июля 2017 года являюсь действующим сотрудником (стажер-исследователь) лаборатории анализа больших данных НИУ ВШЭ.

            Веду лекции по курсу “Искусственный интеллект и большие данные” в рамках программы Data Culture НИУ ВШЭ. Ранее вёл семинары по курсу “Современные методы машинного обучения” НИУ ВШЭ.

 

Область интересов

  • Физика Высоких Энергий
  • Машинное обучение
  • Обучение с подкреплением
  • Байесовские методы машинного обучения
  • Глубинное обучение
  • Этическое машинное обучение

 

 

Компетенции

  • Programming (Python/Scala/Java)
  • Big Data - ETL (Elastic Search/Solr), Spark, DataStax Enterprise, Hive, NoSQL (Cassandra/DynamoDB), AWS (DynamoDB/SQS/SNS/S3)
  • Machine Learning - Supervised/Unsupervised Learning, Deep Learning, Reinforcement learning, Bayes ML, Ethic ML
  • SQL/Queues - PostgreSQL, Redis, RabbitMQ
  • Others – Docker (+Rancher), Telegram Bots

 

 

 

Научные достижения

            В рамках своей курсовой работы 1 курса магистерской программы ФКН ВШЭ успешно реализовал нейросеть, способную обучаться на Монте-Карло событиях без переобучения, давая сравнимое качество классификации на реальных событиях. Данная работа имеет огромную важность для применения глубинного машинного обучения к идентификации элементарных частиц в физике высоких энергий. С этой работой мы успешно выступили на международной конференции ACAT 2017 и на данный момент публикуем статью, посвященную данному методу.

              В рамках своей дипломной магистерской работы успешно реализовал глубинную нейросеть с плоским профилем эффективности. Работа проводилась в рамках гранта РНФ (см. ниже). Полученные в ходе исследования результаты позволили обучать модели глубинного обучения, одинаково хорошо работающие в разных регионах значений интересующих нас переменных. Такие модели машинного обучения представляют огромный интерес в физике высоких энергий, в частности в идентификации элементарных частиц. Ранее никому не удавалось обучать нейросети с таким свойством. По данной работе также планируется публикация и доклад.

 

Гранты

Организация РНФ

Программа «Проведение исследований научными группами под руководством молодых ученых»

Название “Поиск новой физики в данных LHCb с применением методов глубокого обучения”

Номер 17-72-20127

 

Публикации

Конференции

 

Преподавание

  • Семинары, майнор Современные методы машинного обучения, НИУ ВШЭ (Высшая Школа Экономики), 2017 
  • Лекции,  Искусственный интеллект и большие данные, Data Culture, НИУ ВШЭ, 2018
 

 

 

Образование 

 

Новосибирская Физико-Математическая Школа (СУНЦ НГУ) 

 

Год выпуска: 2011 

Средний балл: 4.9 

Достижения:  

• Многократный призёр Всесибирской олимпиады школьников по Физике (2009-2011) 

• Многократный призёр Всесибирской олимпиады школьников по Математике (2009-2010) 

•  Победитель Всесибирской олимпиады школьников по Физике (2009, 2011) 

• Победитель регионального этапа Всероссийской олимпиады школьников по Физике (2011) 

 

 

Новосибирский Государственный Университет (НИУ НГУ) 

 

Форма обучения: дневная, очная 

Степень: Бакалавр 

Год выпуска: 2015 

Факультет: Физический 

Направление: Кафедра Физики Элементарных Частиц 

Средний балл: 4.5 

Выпускной диплом: Калибровка калориметров на основе тяжелых кристаллов (NaI, BGO) по краю спектра однократного тормозного и Комптоновского излучений с использованием генератора Монте-Карло 

Достижения:  

• Победитель Всероссийской студенческой олимпиады по математике ("Магистратура МФТИ", МФТИ, 2015, 1-е абсолютное место) 

• Призёр Всероссийской студенческой олимпиады по физике ("Магистратура МФТИ", МФТИ, 2015) 

• Победитель Новосибирской региональной студенческой олимпиады по теоретической и прикладной механике (2014) 

• Многократный победитель студенческой олимпиады НГУ по теоретической и прикладной механике (2014-2015) 

 

Высшая Школа Экономики (НИУ ВШЭ) 

 

Форма обучения: дневная, очная 

Степень: Магистр 

Дата окончания: 2018 

Факультет: Computer Science 

Направление: Data Science 

Graduating diploma: Обучение нейросетей с равномерным профилем эффективности для детектирования элементарных частиц

 

 

Дополнительные курсы 

ШАД (Школа Анализа Данных, Яндекс) 

Форма образования: очная, Новосибирский филиал 

Дата окончания2017 

Направление: Computer Science 

Курсы: 

Algorithms and Data Structures of Search 1, 2

Discrete Math and Statistics 

C++

Parallel and Distributed Calculations

Python

Machine Learning 1, 2

Deep learning

Reinforcement learning

• Bayes machine learning

 

Языки 

• Русский (Native) 

• English (Upper-Intermediate). Fluent reading and writing 

 

 

Опыт работы

Организация LAMBDA (лаборатория анализа больших данных НИУ ВШЭ)

Позиция: стажер-исследователь

Период: 15.07.2017-н.в.

Обязанности:

  • Тестирование и формулирование гипотез
  • Изучение статей по современным исследованиям в области ML
  • Применение современных методов машинного обучения

Задачи:

  • Исследование современных методов в применении к идентификации частиц в физике высоких энергий
  • Обучение и тестирование архитектур нейросетей с кросс-доменной адаптацией, инвариантных относительно Монте-Карло данных
  • Обучение и тестирование архитектур

Используемые технологии:

  • Deep Learning – Keras, Tensorflow, Lasagne
  • Machine Learning - SkLearn
  • Programming - Python

Достижения и опыт:

  • Удалось без значимой потери качества обучить нейросеть. Это позволило обучать нейросети, одинаково работающие при детектировании Монте-Карло и реальных событий
  • Удалось обучить нейросеть с инвариантным по задаваемым переменным качеством. Это позволило обучать нейросети для распознавания событий с одинаковой эффективностью вдоль импульса частицы

 

Организация Teleport

Позиция: Machine Learning Expert / Senior Data Scientist

Период: 29.02.2017-31.08.2017

Обязанности:

  • Тестирование и формулирование гипотез
  • Обучение глубинных нейросетей
  • Изучение статей по современным исследованиям в области Deep Learning (Image Segmentation) и Computer Vision, их реализация и тестирование

Задачи:

  • Исследование современных подходов в компьютерном зрении и глубинном обучении
  • Сегментация фото и видео
  • Edge detection
  • Постпроцессинг
  • Участие в реализации закрытого фреймворка для глубинного обучения, основанного на Tensorflow

Используемые технологии:

  • Deep Learning - Tensorflow
  • Computer vision - OpenCV
  • Programming – Python, С++

Достижения и опыт:

  • За короткие сроки разобрался в современных методах применения глубинного обучения к задачам компьютерного зрения
  • Внёс значимый вклад в виде эффективного высокопроизводительного постпроцессинга сегментированных изображений (IoU увеличился на 3%, улучшилось визуальное качество)
  • Реализовал эффективную и быструю архитектуру нейросети для сегментации видео
  • Получил очень хороший опыт работы с глубинным обучением на Tensorflow
 

Организация Double Data

Позиция: Full-Stack Data Scientist/Scala Developer

Период: 01.05.2016-15.02.2017

Обязанности:

  • Тестирование и формулирование гипотез
  • Обучение, тестирование и деплой ML-моделей
  • Написание кода
  • Обработка больших данных

Задачи:

  • Реализация закрытого инструмента для поиска людей в социальных сетях
  • Тестирование гипотез и построение ML-моделей (pointwise-) ранжирования
  • Построение Data Lake – витрины данных
  • Обработка больших (200 Тб) данных на Spark. Оптимизация Spark-джоб
  • Анализ социальных графов (> 1Тб) на Spark
  • Написание и тестирование кода для поискового движка
  • Разведочных анализ данных
  • Построение моделей кредитного скоринга

 

Используемые технологии:

  • Machine Learning – t-SNE, SkLearn, XGBoost
  • Python – Flask, PySpark, PyTest
  • Scala – Akka, Akka Http, JUnit, Mockito
  • Big Data – Spark, ElasticSearch ETL

Достижения и опыт:

  • В команде из 4 человек за 3 месяца с нуля реализовали поисковый движок, позволивший находить 60% (Recall) заёмщиков  с 5% (1 – Precision) ошибкой
  • Получил опыт обработки реально больших (>200 Тб) данных на Apache Spark. Научился эффективно оптимизировать Spark-джобы
  • В хорошей степени овладел навыками анализа данных и визуализации на Python
  • Очень много попрактиковал TDD-подход к написанию HighLoad-кода
 

 

Организация SurfingBird

Позиция: Full-Stack Data Scientist/Scala Developer

Период: 19.10.2015-29.04.2016

Обязанности:

  • Тестирование и формулирование гипотез
  • Написание кода
  • Обработка больших данных

Задачи:

  • Разработка, оптимизация и поддержка архитектуры рекомендательного движка
  • Разработка, мониторинг и поддержка рекомендательных алгоритмов
  • Сегментация пользователей (в т.ч. Realtime)
  • Выделение ядра пользователей

Используемые технологии:

  • Machine Learning – Topic Modeling, Sentiment Analysis, Recommendations, Clustering, SVD, PLSA, LDA
  • Programming – Python, Scala, Java, SQL, PostgreSQL, Redis, RabbitMQ
  • Big Data – Spark, SparkML, ElasticSearch ETL, Solr ETL, Cassandra, DataStax Enterprise

Достижения и опыт:

• Разработал и внедрил в production очень эффективный алгоритм стриминговой сегментации пользователей. Впоследствии это позволило решить проблему холодного старта для площадок с очень разреженным трафиком. Такая сегментация пользователей по контенту давала CTR, отличающийся на 0.09% от стандартных алгоритмов коллаборативной фильтрации. Это очень хороший результат для латентных моделей рекомендательных систем 

• Очень эффективно оптимизировал некоторые алгоритмы рекомендательной системы на Spark. В некоторых случаях это ускорило время расчёта алгоритмов в 5 (!) раз. Как следствие, очень большой прирост CTR 

• Проделал очень большой рефакторинг legacy-кода (порядка 4к строк Scala-кода) 

• Разработал новые, очень эффективные, рекомендательные алгоритмы (Включая модели sentiment analysis и topics modeling

• Оптимизировал запросы в ElasticSearch. На некоторых очень крупных рекомендательных площадках это дало относительный прирост CTR на 45% (!) 

• Научился применять Spark для аналитики и агрегации больших данных 

• Написал алгоритм предсказания популярности страниц по репостам в соцсетях 

• Написал распределённую систему для онлайнового пересчёта рекомендаций 

• Сделал очень много различных отчётов с использованием Python, Spark и SQL 

 

Расписание занятий на сегодня

Полное расписание

Три сотрудника лаборатории стали лауреатами стипендии имени Ильи Сегаловича 2020

13 апреля состоялась трансляция, на которой были оглашены лауреаты стипендии имени Ильи Сегаловича на 2020 год.

Первый семинар на Покровке

Лаборатория методов анализа больших данных переехала в новый кампус ВШЭ по адресу Покровский бульвар, д 11, строение 4