• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
24
Ноябрь

Python и данные в практике

Магистры II курса проанализировали решения судей

Mari Helin

Mari Helin
Алексей Смагин, Виолетта Власова, Валентина Мызина, Андрей Нестеров и Карина Чотчаева выявили плагиат в текстах судебных актов за 2017-2018 годы. 
Дата-исследователи нашли около 50 тысяч документов, тексты которых совпадают еще хотя бы с одним решением одного и того же судьи минимум на 80%. 
По словам второкурсника Алексея Смагина, идея исследования возникла благодаря Андрею Заякину, сооснователю сообщества «Диссернет», ресурса по выявлению плагиата в диссертациях. Ребята писали код на Python и парсили данные с соответствующих сайтов. 
«Помимо программирования было много чтения "глазами" — Андрей смотрел уже найденные совпадения и пытался понять, насколько они оправданы, и что эти судебные дела объединяет», - комментирует Алексей Смагин. 
А до этого студенты-практиканты работали над разметкой текстов: искали фабулу и реальные обстоятельства дела. 
В результате журналисты составили "рейтинг" районных судов, которые копируют решения. С материалом можно ознакомиться здесь
Хотите уметь также? Приходите к нам учиться!

Алексей Смагин, Виолетта Власова, Валентина Мызина, Андрей Нестеров и Карина Чотчаева просмотрели при помощи алгоритмов 780 тысяч приговоров российских судов за 2017-2018 годы.

Дата-исследователи нашли около 50 тысяч документов, тексты которых совпадают еще хотя бы с одним решением одного и того же судьи минимум на 80%.

По словам второкурсника Алексея Смагина, идея исследования возникла благодаря Андрею Заякину, сооснователю сообщества «Диссернет», ресурса по выявлению плагиата в диссертациях. Ребята писали код на Python и парсили данные с соответствующих сайтов.

«Помимо программирования было много чтения "глазами" — Андрей смотрел уже найденные совпадения и пытался понять, насколько они оправданы, и что эти судебные дела объединяет», - комментирует Алексей Смагин.

До этого студенты-практиканты работали над разметкой текстов: искали фабулу и реальные обстоятельства дела.

В результате журналисты составили рейтинг районных судов, которые копируют решения. С материалом можно ознакомиться здесь.

Хотите уметь также? Приходите к нам учиться!