«Больше кода»: Евгений Погребняк о машинном обучении и роли человека в нём

ТЕКСТ  Вера Баркатина
Просмотров 857
Как цифровизация меняет рынок труда? Незадолго до окончания университета наш автор Вера Баркатина, как и многие студенты 4 курса МГИМО, решила заглянуть на HeadHunter и посмотреть вакансии по своей специальности. Примечательно, что по тегу «экономист» портал ей почти ничего не выдал. Неужели одна из самых популярных профессий перестала быть востребована? Этот вопрос редакция «Международника» решила задать декану факультета финансовой экономики МГИМО Евгению Погребняку. Он рассказал нам, какими навыками должен обладать профессионал в эпоху 4.0, чтобы найти общий язык с самыми передовыми технологиями и построить успешную карьеру.

Как вы считаете, нужно ли экономисту в эпоху цифровизации развивать компетенции в области Data Science, анализа данных?

У экономиста есть все возможности работать в сфере анализа данных. Для получения диплома бакалавра ему всегда необходимо освоить эконометрику и фундаментальные дисциплины в её основе — анализ, линейную алгебру, тервер, — эти же дисциплины должен был изучить и дата-аналитик. 

Но на рынке труда мы видим, что на 100 вакансий Data Scientist приходится пара-тройка с заголовком «Эконометрист» — получается, первый вариант более востребован, его лучше воспринимают и понимают работодатели. В данной ситуации экономист оказывается в несколько ущемлённом положении: вроде у него и есть все базовые навыки, но складывается впечатление, что нанять хотят другого специалиста. 

Ещё один немаловажный факт: традиционно эконометрику преподают на специализированных программных пакетах, но в Data Science требуется знакомство с R или Python, этого не хватает в традиционном наборе навыков экономиста.

Следующий шаг — занять и нишу инженера в области анализа данных, ориентироваться в обработке данных (не пугаться, если надо сделать запроc SQL или вызов какого-то API) и понимать форматы, в которых они распространяются (чем CSV файл отличается от JSON’а или привычного файла Excel), а главное — осознавать, какую пользу для компаний и для инвесторов можно получить из этих данных. 

Резюмируя, могу сказать, что новый, современный экономист — это инженер, который знает, как обращаться с данными и строить решения на их основе.

Бытует мнение: если человек не знаком с программированием на уровне разработчика, то область машинного обучения для него закрыта. Так ли это?

Традиционный способ войти в анализ данных — много программировать и изучать модели, пробовать их на разных учебных данных, со временем добраться до бизнес-задач и найти ответ на вопрос «Чем же эти модели могут быть полезны?». Этот подход трудоёмкий, несёт в себе много открытий и подходит тем, кто хочет в первую очередь совершенствовать технические компетенции. Но есть и альтернатива — подход со стороны постановки задачи, который также оказывается очень продуктивным и интересным, даёт дополнительную мотивацию.

Предположим, у вас есть коллега, который очень хорошо знает все программные методы. Казалось бы, именно такой специалист может реализовать весь проект от и до, но его нередко ожидает фиаско уже на этапе постановки исходной задачи. Сформулировать успешный проект в области машинного обучения невозможно без знания предметной области, текущих проблем конкретного бизнеса. Именно по этой причине мы в МГИМО в процессе обучения делаем акцент на задачи, которые могут решаться с помощью данных и алгоритмов. Подходя к машинному обучению с этой стороны,

мы развенчиваем миф, что есть какая-то супертехнология, которая сможет за человека сделать абсолютно всё, сама и без вмешательства человека.

То есть машинное обучение — это не панацея и не магия, как о нём принято думать? 

У нас в конце прошлого года был семинар «Магия и реальность машинного обучения», который проводился с компанией Google. Целью было показать, что в область машинного обучения могут войти специалисты из предметной области — лингвисты, юристы, экономисты, политологи, — которые готовы работать над нестандартными задачами, но не обязательно технически подкованы в программировании и моделировании. Мы постарались снять блоки, которые были у студентов, и сделали всё, чтобы помочь им лучше разобраться в том, какие проекты им могли бы подойти и какие из них имеют наибольший потенциал для успеха. После семинара мы продолжили методическую работу и надеемся, что в следующем году для студентов МГИМО сможем предложить онлайн-курс в сфере машинного обучения.

Получается, что ценность проектов машинного обучения не только в коде, но и в креативном и структурированном мышлении экономистов, формулирующих задачу?

Определённо. В конечном счёте кто-то должен будет сесть и написать код, это важная стадия, но не единственная, которая определяет успех проекта. От логических навыков и глубокого понимания бизнес-процессов клиента, конкретного запроса на старте зависит очень и очень много. И студенты МГИМО способны проникнуться задачей улучшения бизнеса или проведения глубоких социальных, гуманитарных исследований.

В эпоху кросс-функциональных команд это особенно важно. Мы сделали семинар открытым для студентов со всех направлений подготовки. Приятно было наблюдать, как экономист давал политологу ценный совет по анализу текстов выступлений иностранных общественных деятелей, а лингвист мог поделиться стоящими идеями в области распознавания текстов.

В чём, на ваш взгляд, залог успеха в постановке задач для программистов? Из чего в целом состоит этот процесс? 

Нужно определить доменную сферу, в которой мы работаем, — к примеру, охрана окружающей среды, вывоз мусора или же работа сайта электронной коммерции. Далее нужно найти проблему — неудовлетворённость потребителя в какой-то области, нераскрытый вопрос в исследованиях, решение которого может дать существенный выигрыш. Часто этих вопросов бывает много, и нужно определить мастер-задачу, что не так-то легко, не делать всё и сразу. Мастер-задача и должна стать основной темой и посылом проекта. Мы должны зафиксировать, для кого решается выбранная проблема, и убедиться, что она действительно актуальна. Тогда её решение либо даст выигрыш в деньгах, либо принесёт социальную выгоду или продвижение в исследовании. На прошедшем семинаре мы учили работать именно с этим.

Расскажите, а есть ли такие задачи, которые машинное обучение решить не может даже при идеальной формулировке? 

Проекты в области машинного обучения можно разделить на стандартные индустриальные задачи, для которых уже известно, что нужно делать, и инновационные задачи, в которых не существует никакого шаблона. К первой группе относится, например, оптимизация выдачи интернет-страницы в поисковике или рекомендательные системы в интернет-коммерции.

Когда речь заходит об исследовательских задачах, то число провалов машинного обучения многократно увеличивается. Неудачи обычно связаны с проблемами на этапе сбора данных, выбора и адаптации моделей либо с отсутствием конкретного потребителя, для которого результат анализа был бы полезен.

Интересно, что наибольший прогресс наблюдается в тех задачах, где легче всего можно применить результаты. Предположим, вы создали прогноз на котировки и у клиента не возникает проблемы с тем, чтобы реализовать ту или иную рекомендацию: купить или продать ценную бумагу. В других отраслях от потребителей прогноза требуются более активные действия. Так, в сфере перевозок мы можем спрогнозировать спрос на такси, но возникают варианты, что именно должен сделать агрегатор — повысить цены, вывести дополнительные машины на линию, что-то ещё. 

Как вы считаете, есть такие сферы, в которые с методами машинного обучения лучше не вторгаться?

За этим вопросом стоит почти философская дилемма: а всё ли мы можем контролировать с помощью данных и всё ли стоит автоматизировать? Ответ с технократической позиции: больше данных — больше автоматизации. Это двигает наш прогресс. 

В то же время существуют примеры, когда регламентация процессов и привлечение большего числа данных всё портит. В Голландии был эксперимент по оказанию помощи пожилым людям. Для медсестёр, которые приезжали к ним домой, зарегламентировали процедуры работы. Качество и результат таких процедур сильно упал. Напрашивается вывод: не всё, что люди способны делать хорошо и профессионально, легко поддаётся описанию. Кроме того, стоимость создания модели может быть непомерно высокой по сравнению с теми решениями, которые человек принимает, исходя из своего опыта и разносторонних компетенций. 

Какие новые практики в образовании способствуют повышению конкурентоспособности выпускников вашего факультета на рынке труда?

Современное образование — это не передача знаний, как в средневековых университетах, где эти знания были только за этой стеной. Сейчас информация доступна везде, а роль университета — придать мотивацию к предмету, показать, что изученной теории можно найти практическое применение. Скорректировать путь обучения и помогать студентам, которые осваивают материал не так быстро или легко, как того требует учебный план. Мы на факультете финансовой экономики стараемся максимально полно реализовать каждую из трёх задач — мотивацию, практику и индивидуализацию обучения. 

Находясь в контакте с HR-отделами компаний, мы готовим студентов к универсальной и долгосрочной карьере, развивая в них адаптивность. На нашем факультете ведётся подготовка специалистов по трём направлениям: экономике, менеджменту и бизнес-информатике. Мы стараемся отслеживать тренды по каждому из этих направлений. И если находим интересную тему, о которой необходимо рассказать, или новый навык, то мы открываем доступ к такому курсу сразу для всех специальностей.

Сейчас мы считаем актуальными модули по основам программирования, развитию коммуникации и навыков работы, написанию текстов. Внедряя программирование на стороне преподавания, мы показываем студентам, как они могут использовать коды для решения учебных, а в дальнейшем и профессиональных задач. 

Кого, по вашему мнению, хотят видеть в числе своих сотрудников IT-компании? 

Вокруг сферы IT и анализа данных есть много мифов. Чтобы у студентов была возможность погрузиться в данное направление, мы на факультете открыли в этом году набор на магистерскую программу «Экономика IT и управления данными». Она подходит как для людей с исходным гуманитарным образованием, так и для «технарей» и сочетает в себе цикл дисциплин по созданию и сопровождению IT-продукта, анализ данных, ряд финансовых и экономических дисциплин и делает акцент на развитии гибких навыков, необходимых для построения карьеры в цифровой среде. Выпускники такой программы будут востребованы не только в IT-сфере, но и во всех секторах, внедряющих IT-технологии.

июль 2021