Смена курса: как стать аналитиком больших данных

Фото: Michael Bocchieri / Getty Images
Фото: Michael Bocchieri / Getty Images
Программный директор Академии больших данных MADE Илья Макаров — о том, каким должен быть хороший дата-аналитик и как им стать

Специалисты по анализу данных (Data Scientists) остаются одними из самых востребованных на рынке. Спрос на них с каждым годом только увеличивается: по данным HeadHunter и Академии больших данных MADE от Mail.ru Group, с 2015-го по 2019 год количество вакансий выросло почти в десять раз. Причина — цифровая трансформация. Все больше компаний понимают, что цифровизация бизнес-процессов способна повысить их конкурентоспособность за счет сокращения издержек, предсказания перспектив проектов, персонализации работы с клиентами и так далее.

Растущий спрос подогревает и интерес к работе с данными (Data Science) со стороны самих специалистов. В среднем каждый месяц на HeadHunter появляется 246 таких резюме. А менее чем за год (с июля 2019 года по апрель 2020 года) их количество увеличилось на 33%.

Работа с большими данными притягивает интересными задачами, большими перспективами и высоким потолком зарплат (гораздо выше, чем в разработке). Многие сегодня ищут пути в эту сферу. И хотя протоптанных дорожек нет, есть секретные тропы, по которым добраться до работы мечты можно быстрее.

Фото:РБК Тренды
Экономика образования 150 профессий будущего

Эволюция профессии: от 1960-х годов до наших дней

Кого-то это может удивить, но анализ данных — совсем не новое направление. Первые специалисты в этой области появились еще в середине 1960-х годов, когда начали зарождаться методы извлечения полезной информации из данных. Современные специалисты отличаются от этих первопроходцев большим набором доступных инструментов для работы — компьютеров, фреймворков (начиная с Excel и заканчивая профессиональным ПО вроде Sklearn, RapidMiner, TensorFlow и прочими), и неограниченным доступом в интернет. А еще — более сложными и интересными задачами, которые появились благодаря развитию технологий.

Если раньше данные анализировали в основном для того, чтобы мониторить процессы, то теперь есть возможность строить предиктивные модели, предсказывать последствия тех или иных шагов или изменений рыночной ситуации и своевременно реагировать на нее.

Футурология Предикативная аналитика: как предсказать эпидемию и успех в бизнесе

Идеальный Data Scientist: кто он и как им стать

Специалист по анализу данных может работать в отраслях, где актуальны принятие решений на основе данных, оцифровка и моделирование бизнес-процессов. То есть практически в любой отрасли. Активнее других этих специалистов ищут ИТ-компании, предприятия финансового сектора и сферы услуг для бизнеса.

Освоить базовые навыки работы с данными может практически любой человек, обладающий минимальными знаниями в высшей математике и программировании. При этом для новичков появляется все больше средств автоматического машинного обучения и конструирования архитектур, которые можно использовать без специализированных знаний в отрасли. Все, что нужно, — правильно настроить готовую модель для решения конкретной задачи и применения ее не специалистами машинного обучения. Она сама будет определять функцию потерь и визуализировать метрики качества, параметры производительности и другие показатели. На выходе получается обученная модель с анализом ее производительности на представленных данных.

Но чтобы стать действительно высококлассным специалистом, нужно копать глубже.

Знания и умения

Основы математической статистики, линейной алгебры, математического анализа и программирования — необходимая база для того, чтобы вырасти в хорошего специалиста по анализу данных. Так что если человек задумался о карьере в этой области до поступления в вуз, стоит выбрать университет, где можно получить эти знания.

Курс «Профессия Аналитик данных» — обучение аналитике данных с нуля

Также важно понимать, как устроена сфера, какие задачи и модели сегодня особенно актуальны, определиться, с каким типом данных интереснее работать, оценить ситуацию на рынке — выяснить, какие специалисты нужны бизнесу. Например, не так давно больше всего вакансий было в области компьютерного зрения, а сегодня уже на пике популярности обработка текстов. Завтра, вероятно, лидерство захватят графовые нейронные сети и рекомендательные системы. Все меняется очень быстро, поэтому идеальный вариант — не зацикливаться на одной области, ведь чем больше разнообразных задач способен решать специалист по работе с данными, тем больше он востребован.

Компетенции, необходимые специалисту в области больших данных, можно разделить на две большие группы: профессиональные и надпрофессиональные. К первым относятся такие навыки, как:

  • инжиниринг данных (Data Engineering);
  • поддержка инфраструктуры;
  • внедрение моделей и поддержание их жизненного цикла;
  • оценка рисков;
  • понимание целей внедрения продукта;
  • оценка экономического эффекта от внедрения продукта;
  • умение быстро прототипировать решения.

Помимо этого, хорошего специалиста отличают: стремление постоянно углублять и актуализировать свои знания в соответствии с потребностями бизнеса и способность переключаться на новые задачи и методы.

Фото:Unsplash
Экономика образования Пять ключевых soft skills для программиста

Часто переквалифицироваться на работу с большими данными хотят специалисты с опытом работы в других областях ИТ. Для них кратчайшим путем будут образовательные проекты крупных компаний.

Совет тем, кто мечтает о карьере специалиста по анализу данных: помните, что от вашей активности и организованности зависит гораздо больше, чем от выбора места обучения. Необходимы желание достигать результат, любопытство и целеустремленность, а также объединяющая всех специалистов по искусственному интеллекту вера в то, что вы меняете жизнь к лучшему.

Спрос больше предложения?

В России сообщество высококлассных специалистов очень узкое, и порог вхождения в отрасль довольно высокий.

Российская система образования зачастую не успевает адаптироваться под меняющиеся требования рынка. Программы обучения в вузах зачастую не прививают студентам критическое мышление в рамках научной деятельности. В результате выпускники без опыта работы, претендующие на работу в области больших данных, не всегда могут справиться с чем-то серьезнее, чем обучение готовых моделей из интернета или научных статей.

Игроки рынка совместными усилиями стремятся решить эти проблемы. Крупнейшие ИТ-компании запускают собственные программы обучения в самых актуальных сферах, нацеленные на подготовку специалистов среднего и высшего звеньев. Они позволяют получить свежие знания и опыт из первых уст от специалистов отрасли. При этом помощь государства могла бы ускорить процесс и, например, увеличить поддержку научных школ.

Язык данных — для решения проблем мирового масштаба

Сегодня навыки работы с данными становятся новым универсальным языком для исследователей. За примером далеко ходить не надо. Так, в борьбе с COVID-19 ученые со всего мира объединили усилия в поиске лекарств и разработке вакцин, а также анализе научных публикаций, прогнозировании распространения эпидемии, предсказании по результатам КТ и характеру кашля вероятности заражения коронавирусом.

Фото:РБК Тренды
Индустрия 4.0 Большие данные против коронавируса: 24 модели окончания пандемии

Это доказывает, что человечество обладает необходимыми средствами для того, чтобы дать отпор неожиданно появившемуся противнику, и способно разговаривать на одном языке — языке данных.

Обновлено 29.12.2023
Главная Лента Подписаться Поделиться
Закрыть