Специалисты в области Data Science о том, с какими трудностями приходится сталкиваться при поиске новых сотрудников среди студентов, почему образовательные проекты Mail.ru и Яндекса – это круто, и как не потерять себя в мире IT.
За BIG DATA и машинным обучением настоящее и будущее IT-индустрии, в этом уверены многие компании. Задумайтесь сами: сегодня машина может узнать ваш пол по поисковым запросам, а через несколько лет она определит, чем вы хотите позавтракать именно в это утро, опираясь на статистические данные из вашего прошлого и биометрические показатели. Звучит заманчиво, но поскольку направление новое, этому пока мало где учат. Заинтересованные компании создают собственные образовательные проекты для обучения Data Science, такие как Школа анализа данных (ШАД) у Яндекса и Техносфера у Mail.ru. Почему компаниям недостаточно уровня обычных студентов, и как из обычного студента превратиться в высококлассного специалиста рассказали участники конференции «РИФ+КИБ 2016», эксперты в области машинного обучения – Павел Клеменков и Николай Анохин.
- В вашей компании довольны уровнем студентов, которые устраиваются на работу?
Павел Клеменков: В сфере Data Science – очень недовольны. Сейчас места в России, где этому учат, можно сосчитать буквально по пальцам одной руки, там очень высокая конкуренция. Качественное образование в этой сфере получить сложно.
Николай Анохин: Действительно, уровень приходящих сотрудников невысок, даже если рассматривать не только студентов. Среднее время поиска сотрудника у нас составляет где-то полгода. Сложно сказать, хорошо это или плохо, но найти кого-то достойного непросто.
- Кажется, что анализ данных – такая область, в которую приходят работать люди, определившиеся с тем, чем они хотят заниматься, опытные и уже что-то умеющие. Получается, что даже среди них уровень невысок?
Павел Клеменков: Да, даже среди таких людей уровень довольно низкий. Складывается такая ситуация, когда нам приходится понижать планку, чтобы обеспечивать хоть какой-то поток новых кандидатов, но даже при таких условиях нам подходит, в среднем, только один из двадцати.
Николай Анохин: Сейчас анализ данных становится популярной темой, и многие как раз выбирают её по принципу «это интересно, об этом много пишут – почему бы не попробовать?» – такие люди, скорее всего, не будут обладать достаточными знаниями. Нам встречаются также и кандидаты с более глубокими профессиональными навыками, с опытом работы, но и они далеко не всегда нам подходят.
- Чего обычно не хватает тем, кто не проходит собеседование?
Павел Клеменков: Большинству не хватает базовых знаний в области машинного обучения и анализа данных. Некоторые люди, которые приходят на собеседование, обладают отметками о пройденных онлайн-курсах по этим темам, но это не всегда является гарантией знаний – часто выясняется, что они из этих курсов не вынесли ничего полезного.
Николай Анохин: Обычно у людей, которые к нам приходят, есть навыки только в одной области: либо это хорошие программисты, которые мало понимают в анализе данных, либо, наоборот, они разбираются в анализе данных, но плохо программируют. А вот найти тех, кто обладает знаниями в обеих областях действительно непросто.
- Как на общем фоне смотрятся выпускники специализированных образовательных проектов по анализу данных, например, ШАДа и Техносферы?
Павел Клеменков: Их уровень значительно выше среднего. Лучше, чем выпускники ШАД, пожалуй, ребята, окончившие факультет компьютерных наук ВШЭ. Однако и среди таких кандидатов уровень не всегда достаточный.
Николай Анохин: По сравнению с людьми, которые не заканчивали этих программ, они смотрятся очень хорошо. В Техносфере мы, в каком-то смысле, гарантируем необходимый уровень. На работу мы берем выпускников с хорошими оценками, которые освоили именно необходимые нам знания. Выпускники ШАДа также демонстрируют высокий уровень, гораздо выше среднего, так что участие в образовательных проектах – это полезно.
- В сфере IT постоянно появляется что-то новое. Анализ данных – пример такой отрасли, которая появилась относительно недавно. Как вы считаете, университеты должны поспевать за «трендом», постоянно модифицируя свою программу, или, наоборот, давать некоторые базовые знания, благодаря которым студент сам сможет изучить что угодно?
Павел Клеменков: Я заканчивал МГУ, где реализован второй поход: в университете дается фундаментальное образование, которое хорошо ставит мозги на место. Но на этом, к сожалению, все заканчивается: практических знаний нам давали достаточно мало и они, в основном, были уже не актуальны. На мой взгляд, правильный подход – на первых курсах давать студентам базу, а на старших курсах заниматься тем, что необходимо в индустрии. В этом плане шестилетняя программа – бакалавриат плюс магистратура – может оказаться очень эффективной.
Николай Анохин: В МФТИ, где я учился, на первых курсах закладывался фундамент, математический и алгоритмический, а на старших курсах можно было работать на базовых кафедрах, получая реальный опыт ещё в процессе написания диплома. В МФТИ большинство базовых кафедр – научные, они работают для НИИ и занимаются не совсем тем, что необходимо в индустрии. Там есть и промышленные кафедры, например, совместные кафедры с Яндексом, с Abby, но, на мой взгляд, их должно быть больше.
- В мире IT уже существуют и продолжают появляться десятки направлений и сотни технологий. Как понять, какое именно направление твое? Зачастую это трудно сделать, пока не попробуешь.
Павел Клеменков: Если ты студент, стажировка – это отличная возможность во всем разобраться. В процессе можно пообщаться с опытными людьми и получить реальные знания. Если ты пришел из другой области – нужно развиваться самостоятельно, читать книжки и ходить на собеседования.
Николай Анохин: Стажировка – это хорошая штука. У нас было много случаев, когда стажер, поработав какое-то время, говорил, что это не совсем то, чем он хотел бы заниматься, и переводился в другое отделение в рамках все той же стажировки. Вряд ли существует более удобный способ попробовать разные виды деятельности. Если нет возможности пройти стажировку – стоит работать над какими-то проектами самостоятельно или с друзьями, обычно реальные проекты включают в себя большинство IT-направлений: frontend, backend и даже, возможно, какой-то анализ данных.
- А как начинался ваш путь как специалиста? С какими трудностями приходилось сталкиваться на первых порах?
Павел Клеменков: Я начинал работать промышленным программистом. В этой сфере все гораздо проще: программированию в России учат хорошо. Поначалу, конечно, не хватало практических навыков, знаний о специфике используемых решений. Было базовое понимание, как решать задачу, но в индустрии хорошо бы ещё и руками уметь это сразу сделать. В Рамблере я сначала работал программистом в отделе Рамблер.Новости, где мы решали совместные задачи с отделом машинного обучения. Потом я стал тимлидом Новостей, а затем уже и руководителем отдела машинного обучения.
Николай Анохин: Работать на полставки я начал где-то с четвертого курса. После университета я не умел промышленно программировать – у меня было знание необходимого языка, С#, но не было никакого опыта построения реальных проектов, знания архитектурных паттернов. По этой причине процесс разработки сначала вызывал у меня шок. Очень трудно было войти в проект. После окончания МФТИ, я поступил в университет Лиона на специальность «анализ данных», работал некоторое время за границей, и в 2012 году вернулся в Россию. Тогда ещё в этой сфере специалистов практически не было и устроиться на работу было значительно легче, чем сейчас.
- Наступает какой-то момент, после которого ты понимаешь, что стал профи, и все инновации в твоей области воспринимаются легко? Или приходится постоянно нагонять индустрию?
Павел Клеменков: Конечно, постоянно надо сидеть, изучать, догонять современную науку, не отставать. Со временем ты становишься опытнее и можешь смотреть широко, поэтому хорошие специалисты превращаются в руководителей. Но тут появляется другая проблема: с годами у тебя меняется образ жизни, появляется семья и следить за тенденциями постоянно изменяющейся специфики работы становится сложно. А следить необходимо, иначе пропадает смысл быть руководителем. Из-за этого в кадрах постоянно происходит некоторый круговорот.
Николай Анохин: В анализе данных я не встречал ни одного человека, который знал бы всё, что есть, на высоком уровне. У любого специалиста есть какие-то дыры, и абсолютно точно ему всегда есть, чему учиться - постоянно находится нетривиальный материал, для освоения которого нужно включить голову. Наверное, никогда не наступает такого просветления, когда все понятно с двух слов.
- Какой совет вы бы дали начинающим IT-специалистам, чтобы они стали настоящими профессионалами?
Павел Клеменков: Самое главное – образование. Если ты получаешь качественное образование, оно помогает тебе в будущем. А дальше уже нет никаких правил: нужно пробовать, искать, находить единомышленников. Вариться в собственном соку бесполезно - люди вокруг тоже что-то пробуют и можно с помощью коллективного мнения понять, чего хочешь сам.
Николай Анохин: В университете советую серьезно относиться ко всем фундаментальным курсам и, вообще, пытаться, максимум времени уделять учебе. Те аспекты, которые университет дать вам не может, нужно изучать самостоятельно. Не стоит торопиться выходить на неинтересную, низкооплачиваемую работу, потому что, как показывает мой опыт, инвестиции в учебу очень хорошо окупаются. Чем дольше есть возможность учиться, тем лучше.
Специально для конкурса Mail.ru