• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Компьютерный лингвист

разрабатывает программы для обработки естественного языка, создает инструменты распознавания текста и речи, системы перевода, голосовых ассистентов, персональных помощников, «умных» чат-ботов

Человека окружает большое количество языковой информации, представленной в разных форматах: аудио-, видео-, текстовом. Используя алгоритмы обработки текста, лингвист имеет возможность собрать информацию о необходимых объектах: например, нравится ли зрителям определенный фильм или за кого будут голосовать пользователи твиттера на выборах.

Компьютерные лингвисты разрабатывают программы, которые воспроизводят когнитивную языковую деятельность человека — умение читать, понимать на слух, говорить, участвовать в диалоге, переводить с одного языка на другой. В их задачи входит создание инструментов, которые помогают извлекать лингвистическую информацию из текстов, размечать лингвистические признаки в текстах, создавать ресурсы для хранения лингвистических единиц, например, для хранения слов, их значений, их семантических и морфологических свойств.

Компьютерные лингвисты востребованы крупными IT-компаниями, чья деятельность связана с обработкой больших объемов текстовых или речевых данных. Они могут работать в науке, СМИ, торговле, финансах, здравоохранении — везде, где требуется применение современных информационных технологий к лингвистическим данным.

Оценки рынка

16,1%
составит ожидаемый среднегодовой рост рынка обработки естественного языка в мире в период с 2016 по 2021 год (с 7,63 до 16,07 миллиардов долларов)

Драйверы профессии

  • усиление конкуренции и потребность ком­паний в детальном изучении поведения по­требителей
  • развитие семантического веба, машинного обучения, интеллектуальных систем и т. п.
  • роботизация различных видов деятельно­сти и использование «умных» устройств
  • развитие межмашинных технологий (machine-to-machine technology)

Какие задачи будет решать специалист

  • разработка алгоритмов и методов машин­ного перевода
  • решение задач извлечения информации из неструктурированных или слабоструктурированных документов
  • разработка систем человеко-машинного и межмашинного взаимодействия
  • создание систем генерации однотипных текстов по заданным параметрам (прогноза погоды, биржевых сводок и др.)
  • распознавание речи и выделение имено­ванных сущностей
  • разработка алгоритмов классификации до­кументов по заданным параметрам
  • создание вопросно-ответных систем
  • разработка систем, облегчающих коммуникацию людям с ограниченными возможно­стями

Какие знания и навыки у него будут

  • знание лингвистических технологий и умение выбирать данные, необходимые для решения поставленных задач
  • знание баз данных и других источников, откуда можно получать данные
  • умение программировать прототипы и модели решений, готовить необходимые лингвистические ресурсы, проектировать процесс обработки данных и интерпретировать результаты обработки
  • умение оценивать трудоемкость разных решений, пороги допустимых ошибок и выбирать оптимальную методологию тестирования лингвистических систем

Другие профессии направления «общественные и гуманитарные науки»