В рамках проекта AI Talent Hub компания Napoleon IT и Университет ИТМО запустили магистерскую онлайн-программу «Инженерия машинного обучения». Вместе с партнёрами, в числе которых МТС Digital, они подготовят более 100 высококвалифицированных специалистов Middle уровня. Даниил Потапов, руководитель направления DS Analytics в МТС Digital, рассказал, как именно их команда планирует реализовывать обучение на программе и дал советы талантам, которые готовы «двигать» в Machine Learning.
Приглашенный спикер: Даниил Потапов, руководитель направления DS Analytics в МТС Digital
- Преподаватель Школы аналитиков данных МТС
- Создатель курса на ODS по рекомендательным системам Your first recsys и Your Second RecSys
Проект AI Talent Hub призван объединить талантов, ведущие IT-компании и экспертов из индустрии, чтобы обучить специалистов в области Machine Learning. Одна из специализаций на программе касается рекомендательных систем. Даниил Потапов один из первых, кто серьезно взялся за систематизацию информации и создал целых два курса вместе со своей командой по рекомендательным системам. Благодаря своей экспертизе Даниила часто приглашают участвовать в качестве спикера на IT-конференциях разного уровня.
Нам удалось поговорить с экспертом на тему востребованности кадров в машинном обучении, с какими навыками набирают в МТС Junior специалистов и, конечно, о рекомендательных системах.
- Даниил, расскажи подробнее про команду МТС Big Data. Чем занимаетесь, какие задачи перед вами стоят?
МТС Big Data — это центр, состоящий из более 300 аналитиков и дата-сайентистов. В нём решаются классические задачи ML для МТС: строятся модели, отчёты, собираются и проверяются данные, предоставляется информация для бизнес-вертикалей компании.
Мы выступаем как центр практики — рассказываем о том, как должна быть устроена работа. Например, наши специалисты загружают данные, смотрят, что в них и проверяют качество. После этого строятся витрины и отчёты для заказчиков.
Надо понимать, что МТС — это не одна компания, которая формировалась как единый блок и на всю Россию. Это покупки региональных операторов со своим стеком и правилами. Поэтому данные выглядят, как огромный зоопарк разных форматов. Просто взять и собрать весь массив информации компании в одном месте — сложная задача. Сейчас мы приводим всё к общему знаменателю, чтобы упростить работу и не тратить лишние человеко-часы. Придумываем единый формат, где-то получается успешно, где-то нет. Это работа, в целом, бесконечная.
- Как по твоему мнению изменился рынок труда в машинном обучении с того момента, когда ты пришел в эту сферу?
Я пришел в сферу ML в 2016 году и занимался инженерными вещами. Сейчас мне кажется, что рынок уже прошел стадию специализации, когда есть чёткое разделение труда: бизнес-аналитики, системные аналитики, дата-инженеры. Каждая компания пришла к пониманию, какая им роль нужна. В отделе DS тоже произошли разделения: есть люди, которые занимаются генерацией идей, а есть те, кто ставит в продакшен. И кажется, это разделение пойдёт ещё дальше.
Спрос на эти специальности мне кажется хайповым до сих пор. Потому что не станет меньше данных, задач, их количество будут только расти. Компаниям, чтобы понимать свое место на рынке и удерживать позиции, необходимо обладать данными и использовать инструментарий для их обработки. На государственном уровне это сейчас начнет развиваться усиленными темпами.
- К слову «о своём». Очевидно, что фундаментальные технологии хранения данных редко бывают отечественными. Как крупным компаниям справляться с санкциями? Какой выход ты видишь из этой ситуации?
Санкции бьют сильно. Если в какой-то момент закроют GitHub, если нас просто от каких-то пакетных репозиториев отрежут, будет очень плохо. Мне кажется, что надо разработать собственные решения и развивать их на базе Open Source. Большие компании это уже делают, чтобы быть независимыми.
Многие российские ИТ-компании сейчас выкладывают свои решения в Open Source, дают возможность опробовать эту технологию большему количеству людей, делают жизнь разработчиков лучше. Таким образом, вкладывают не только в развитие себя, но и в развитие среды. Есть в этом и корыстный интерес: такие компании привлекают больше ребят и формируют больше специалистов, которых потом хантят к себе. Опять же, фидбэк от сообщества — это всегда ценно. Получается мини-брейншторм, в котором можно понять, застряли ли мы в старых технологиях, предлагают ли ребята что-то новое.
Open Source — драйвер всей индустрии. Большие компании должны быть во главе этого движения, быть примером. Конечно, это не решается ни одной библиотекой, не двумя, не десятью. Это планомерная работа на протяжении нескольких лет. Главное — не стесняться. Думаю, через какое-то это тоже станет мейнстримом. Ведь всегда можно найти, что еще сделать, что еще улучшить, оптимизировать и заработать на этом очки славы.
Мы тоже начали потихоньку заниматься такими проектами. Забегая вперед скажу, что мы планируем выкатить в Open Source первую версию своей библиотеки в рамках курса по рекомендательным системам.
- Расскажи подробнее про курс, который вы делали по рекомендательным системам вместе со своей командой.
Я пришел в МТС делать рекомендации в 2018 году. Тогда для меня это было что-то новое и я просто ушёл туда с головой. Оказалось, что это направление было не самым популярным — обучающих материалов в сети было крайне мало, подходы разнились, не было практического кода, который можно было взять и скопировать себе. Спустя время решил, что можно закрыть гештальты и помочь другим быстрее вкатываться в рекомендательные системы, не тратя сотни часов, «рыская» по интернету. Подумал о том, что могу сделать какой-то курс, хотя бы задать направление. Да и ниша не занята, есть где себя проявить.
Первый курс делал сам. У меня на это ушел целый месяц, я невероятно устал. Одно дело, когда ты просто объясняешь коллеге, как это работает, и другое дело, когда начинаешь делать курс. Думаешь: «Действительно ли это понятно? А может еще здесь раскрыть?» и начинается спираль, когда ты все время недоволен. Еще надо видео записать, для этого сжать материал. Видео длится 20 минут, но сидел ты и записывал дубли полтора часа. Ко второй части курса уже приобщил ребят.
- Как будет проходить работа с магистрантами в рамках программы «Инженерия машинного обучения» по твоему направлению? Почему тебе, в принципе, стал интересен наш проект?
Все просто, надо двигать отрасль. Если хочешь сделать мир лучше, надо начинать с себя. Если хочешь, чтобы в России продвигали науку, надо начинать самому. Конечно, я не ученый и работаю не «на передовой». Но, находясь на высокой позиции, я могу мотивировать людей к большему и рассказывать о том, как работает индустрия, помогать образовательными материалами.
Поэтому в программе будет фокус на практику. Мы будем рассказывать про то, как реализуются рекомендательные системы, что находится у них внутри, какие бизнес-требования бывают и как они в итоге влияют на работу.
Обязательно будет поддержка менторов, она очень важна. Вся суть в том, чтобы рядом был человек, которому можно задать вопрос, который поможет пройти много разных проектов и понять, что тебе ближе, на чем стоит сфокусироваться.
Создадим свои простые сервисы, которые можно будет потом задеплоить на каких-то открытых облаках и добавить эту строчку в резюме. Ссылка, которая прямо демонстрирует ваши навыки и победы. Я думаю, что это будет очень крутой опыт. Кстати, мы и сами готовы брать на работу ребят после окончания и даже во время обучения, если будут успехи. Ведь это наоборот больше плюс. Что называется «убить двух зайцев одним выстрелом».
- В целом как относишься к подготовке смены кадров через участие в образовательных инициативах?
Крупным компаниям нужен постоянный поток кадров. Во-первых, всегда надо искать свою смену, приводить ребят, которые будут драйвить. Через два-три года работы люди часто чувствуют, что на своей позиции сделали все и начинают искать возможности для роста. Во-вторых, в компании часто за это время меняется стратегия, начинается работа над новыми продуктами, и вот, уже надо нанять ещё 15 человек.
В таких условиях быстро обеспечить потребность в кадрах может только своя школа или сотрудничество с вузами. С рынка найти 15 квалифицированных специалистов невероятно сложно. Можно брать Junior с рынка и начинать растить — это тоже вариант, но скорее для маленьких компаний, которые не могут потратить большие средства для создания своей школы. Мы сейчас идем по пути создания собственных образовательных программ - например, в этом году запустили свою Школу аналитиков данных: мы получили более 3500 заявок, 1100 человек приняли участие в отборочных испытаниях. По итогу 40 человек сейчас учатся на курсе, и 5 из них уже стажируются в командах МТС.
Своя школа или программа в университете выступают первичным фильтром, после которого уже можно общаться с человеком и оценивать, подойдет или нет. Среди других плюсов — положительный имиджевый эффект и и прокачка навыков сотрудников, когда они оттачивают свои ораторские навыки перед студентами.
- Какие требования к Junior специалисту в МТС? На какие качества обращаете внимание?
Если говорить про хард-скиллы, то требования следующие: знать SQL и теорию Machine Learning. Если джун знает, как посчитать среднее время сессии по табличке, то он уже полезен. Остальному мы сами научим. Поэтому при собеседовании большое внимание уделяют софт-скиллам: есть ли у начинающего специалиста мотивации и желание разбираться в новых инструментах, готов ли он посвящать не только рабочее, но и свободное время обучению. Ещё хорошо, когда человек думает о том, как он работает и взаимодействует с коллегами, понимает свои слабые и сильные стороны.
С Junior проблема чаще в том, что он себя таковым не считает. Несоответствие внутренней оценки и внешней обычно бьет по людям. Поэтому всегда полезно проходить собеседования, смотреть результаты и адекватно себя оценивать. Проводить анализ: какие позиции открыты, что спрашивают, что из этого умеешь. Вычислить предлагаемую нижнюю и верхнюю границу по зарплате. Начать с нижней. Получил, подтвердил навыки, теперь пробуй брать больше интересных задач. Идешь на собеседование, смотришь, действительно ли все соответствует. Ведь бывает так, что здесь отвечаешь только за доставку данных, а в соседней компании на такой же позиции можно и до продакшна дотянуться. Если готов, то можно переходить.
Надо постоянно ходить на собеседования, даже когда работаешь. В этом ничего плохого нет. Это лучший способ проверить, что ты в рынке, что твои навыки еще востребованы.
Например, путь с Junior до Middle — это про широту навыков, подбор инструментов под задачу, понимание каких-то механик. Это переход из стадии «Я решаю, потому что мне это дали» до стадии «А зачем я это решаю?». Это когда ты понимаешь, что ты делаешь, зачем и как это сделать лучше. До Middle позиции обычно человек может вырасти за полтора года работы. Вообще, разделение Junior, Middle, Senior — это условности внутри компании. Я часто встречаю ситуации, когда человек Middle в одной компании, Senior в другой.
- Очень много поступивших талантов будут проходить обучение и параллельно работать. Поделись советами, как соблюдать work-life balance?
Я, наверное, самый плохой человек для ответа на этот вопрос. У меня нет work-life balance. Собственно, это может быть и секрет того, где я сейчас. Еще работая на государственном предприятии, я столкнулся с интересными задачами в ML. И чтобы их решать, читал статьи вечером, пока ехал в метро, пока ел. Бывало приходишь домой и больше сил ни на что нет. Мне кажется, это я более менее прекратил перерабатывать в этом году, когда сконцентрировался чисто на менеджменте.
С work-life balance сложно прийти к успеху, если ставишь амбициозные цели. Конечно, если целей нет, то можно и не беспокоиться. Спокойно отработал, карточку закрыл и домой. В этом тоже есть свое счастье. Но если цели амбициозные, надо «пахать».
Проблема у ребят в том, что они движутся по течению и не знают, куда идут. Это приводит к выгоранию. Всегда надо понимать, что ты хочешь от жизни: заработать кучу денег, купить дом родителям, жить не в России или ещё что-то. Всё достижимо, зависит только от времени и сил, которое на это потребуется. Дальше главное не метаться в разные стороны — во всех действиях должен быть смысл. Всё будет образовываться вокруг цели — будут причины что-то делать после работы, вставать по утрам, бегать, отжиматься или прочитать еще одну статью.
Главное, чтобы ребята, которые поступили в магистратуру ответили себе на вопрос: «Каких цели и в какой временной диапазон я хочу достичь?». Возможно, что иногда придется чем-то жертвовать, но мы будем стараться поддерживать и находить оптимальные сочетания.
Полное интервью в записи на youtube канале — по ссылке.