Об эксперте: Михаил Серегин, операционный директор онлайн-школы Data Science karpov.courses.
По данным бюро статистики труда США, к 2032 году количество вакансий в сфере Data Science увеличится на 35%. Эксперты в области больших массивов данных востребованы и на российском рынке, причем бизнес готов сотрудничать не только с опытными дата-сайентистами. По данным hh.ru, только с января по июнь 2024 года компании разместили в четыре раза больше приглашений на стажировки для начинающих специалистов в области Data Science, чем годом ранее.
Считается, что без профильной «вышки» в Data Science не обойтись — даже на старте специалист должен отлично разбираться в математике, статистике, работе искусственного интеллекта и компьютерной инженерии. Но так ли это?
Что делают специалисты по Data Science
Data Science —сфера, которая объединяет аналитику, прикладную математику, программирование и обработку данных. Дата-сайентист применяет большие массивы данных для решения различных бизнес-задач. В том числе создает модели машинного обучения, которые компания может применить в процессах и продуктах.
Это отличает его от аналитика данных, который специализируется на подготовке отчетов и поиске в массивах информации важных закономерностей. Или дата-инженера, который отвечает за состояние хранилища данных и делает их использование максимально удобным.
В практике реальных компаний эти специальности могут сближаться и даже совпадать в рамках одной вакансии. В объявлении о поиске дата-аналитика, например, можно встретить требование «знание ML», хотя машинным обучением должен заниматься дата-сайентист.
В зависимости от того, в какой области Data Science специалист планирует строить карьеру, ему предстоит развивать разные навыки. В необходимый для старта минимум входят знание языков программирования и умение работать с базами данных.
Основные языки Data Science — Python и SQL. Python пригодится в аналитике и ML. А SQL поможет извлекать из базы нужную информацию.
Чтобы расти в Data Science, не обязательно кончать профильный вуз, хотя специалисты с сильным техническим образованием ценятся на рынке. Для быстрого старта можно ограничиться курсами, но важно быть готовым к работе с математическими задачами и к совершенствованию навыков программирования.
На что ориентироваться при выборе обучения в Data Science
Программы дополнительного образования или профессиональной переподготовки в Data Science различаются в зависимости от стартовых навыков и ожиданий студентов.
Чтобы познакомиться со сферой и узнать, подходит ли вам работа в Data Science, достаточно пройти lifestyle-обучение. Это короткие, часто бесплатные программы, которые формируют базовое представление о работе с данными и помогают оценить свои ресурсы и способности.
Такие курсы можно встретить в большинстве крупных онлайн-школ, где есть профиль Data Science.
Примеры lifestyle-программ:
- Бесплатный курс от Skillfactory «Симулятор профессии дата-сайентист»
- Бесплатный курс от «Яндекс Практикума» «Основы анализа данных и Python»
- Бесплатный курс от karpov.courses «Основы Pyton простым языком»
Курсы upskill подходят опытным специалистам, которые хотят повысить компетенции или освоить смежную специальность. Мидл-разработчик, который планирует перейти в крупную технологическую компанию, например, может пройти короткий курс по проектированию систем. Это поможет ему проявить себя на собеседовании: соискатели на менеджерские и инженерные позиции обязательно проходят интервью на знание System Design — разработки и планирования интерфейсов для создания сложных программ.
Примеры upskill-программ:
- Курс от karpov.courses «SYSTEM DESIGN проектирование систем как в big tech компании»
- Курс от Skillfactory «Курс по нейронным сетям»
Наконец, существуют reskill-программы. Они разработаны для тех, кто осваивает новую специальность с нуля или с минимальными стартовыми знаниями и навыками.
Reskill-обучение подойдет специалистам, которые ставят перед собой конкретную карьерную цель. Например, повысить уровень дохода или стартовать в новой сфере — получить нужные навыки, подготовить портфолио, построить первые профессиональные связи.
Примеры reskill программ:
- Курс от karpov.courses «Инженер машинного обучения»
- Курс от «Нетологии» «Профессия Data Scientist»
- Курс от Skillfactory «Data Science в медицине»
Reskill-курсы можно совмещать с работой: все-таки большинство людей, которые планируют сменить специальность, не могут позволить себе отпуск от нескольких месяцев до полутора лет. Хотя «пара часов занятий по вечерам» звучит как что-то очень легкое, если человек действительно минимум два часа в день каждый день уделяет учебе, это дает отличный результат. Чуть проще освоить Data Science будет экспертам смежных специальностей, в том числе социальных наук, финансов, аудита и консалтинга, бухгалтерии, инженерии, продаж — всех профессий, где многое зависит от умения работать с математическими абстракциями. Но отсутствие подобного опыта не является барьером для обучения — просто студенту, который раньше не работал с данными, потребуется приложить больше усилий на старте.
Коммерческий успех reskill-курсов зависит от результатов выпускников. В таких программах работают опытные преподаватели, а студенты на всех этапах получают сопровождение и поддержку.
Какие умения нужны новичку в Data Science
Языки программирования. Основное внимание на любых курсах Data Science уделяется освоению языков программирования, как правило, Python и SQL. Это вызывает ложное ощущение, что аналитик — это, в первую очередь, программист. На самом деле, это не так — просто программирование не знакомо большинству студентов, а овладеть навыком программирования самостоятельно сложно. Установка самых популярных программ для работы с Python, например, требует умения пользоваться командной строкой. Тут можно сравнить Data Science с графическим дизайном, упражняться в котором можно даже из браузера, например, в Figma.
Дизайн эксперимента или AB-тестирование. Практически любой статистический вывод требует сравнения независимых выборок — проведения эксперимента, в котором примут участие несколько групп испытуемых. То есть для того, чтобы утверждать, что изменение Х (например, новая функция или цена на товар) ведет к изменению Y (например, увеличению конверсии в покупку), нужно проверить это экспериментальным путем.
Умение правильно подготовить эксперимент требует довольно серьезной методологической подготовки. В социальных науках этот предмет считается одним из самых сложных для сдачи.
Математическая статистика. После проведения эксперимента математическую статистику нужно применить к его результатам. Когда речь идет о поведении людей, изменение Y из предыдущего примера не в 100% случаев следует за изменением Х. То есть если мы поменяли цену, это не заставит всех людей купить наш товар, это изменит вероятность, с которой это произойдет. Теоретически может быть такое, что эту вероятность мы действительно изменили, но результатов не увидели: наша выборка слишком маленькая, и там повышенная вероятность покупки ни разу не сыграла роль. Эффект может быть и обратный: например, мы ничего не меняли, но все вероятности сдвинулись в нашу сторону. Чтобы понять, есть ли реальный эффект от изменения (раньше покупали 4 из 10 пользователей, а теперь покупают 7 из 10, например), и применяют математическую статистику.
Студентам не потребуется осваивать сложные математические операции, например, интегралы и дифференциальные уравнения. Но необходимо будет развивать навык абстрактного мышления: в основе математической статистики лежит теория вероятностей.
Экономика продукта. Обычно дается проще, чем программирование или статистика. Для любого человека интуитивно понятно, что такое возвратность инвестиций. Иногда требуется овладеть лексикой, принятой в IT. Но в целом после овладения всем инструментарием, перечисленным выше, проблем с экономикой продукта обычно не бывает.
Важно помнить: успешная карьера в Data Science зависит не только от профильных компетенций.
По данным ITFB Group, в 2023 году работодатели стали чаще обращать внимание на гибкие навыки IT-специалистов. Умение работать в команде, например, оценивали 85% нанимающих менеджеров.
Работа в сфере Data Science предполагает большое количество коммуникаций. Хороший специалист легко вливается в корпоративную культуру, умеет проявлять гибкость и сдержанность в конфликтных ситуациях — и профессионально задает вопросы. В IT не так много типовых задач — качественный диалог необходим, чтобы понять требования заказчика и получить лучший результат.
Сам по себе опыт работы с бизнесом также станет преимуществом: специалисту, который уже взаимодействовал с менеджерами или сам принимал управленческие решения, будет проще понять запросы и задачи компании.
Как выпускнику курсов проявить себя и получить оффер
Многие компании открыты к найму начинающих специалистов. Но джуном может считаться не каждый выпускник курсов — для того, чтобы заинтересовать работодателя, важно показать, как ваша работа поможет улучшить результаты бизнеса.
Лучше всего для этой цели подойдет портфолио: реальные кейсы из практики. Но у начинающего специалиста может быть не так много опыта. Вот несколько советов, которые помогут выпускнику курсов показать себя с лучшей стороны:
- Первые реальные задачи клиента полезно решать еще во время обучения. Иногда прямо на курсах эксперты могут дать студентам задачи из текущих проектов компании. Или пригласить решить задачи в симуляторе — они идентичны реальным рабочим задачам бизнеса, и их можно включить в портфолио.
- Хорошо распишите решенные вами задачи. Сделайте акцент на достижениях, а не на процессе. Это покажет работодателю, что вы ориентированы на результат и хорошо понимаете, зачем вы и ваша роль нужны бизнесу.
- Пишите коротко и по делу. Краткость — сестра таланта, а нанимающий менеджер — живой человек. В процессе найма он видит десятки резюме, и если вы сделаете какую-то информацию о себе труднодоступной, специально ее разыскивать никто не будет.
- Подумайте о том, какие задачи из вашего опыта в другой сфере могут быть релевантны. Подойдут даже университетские достижения. Анализ данных — это про умение делать правильные выводы из большого объема информации. И люди делают это постоянно и повсеместно. Даже если вы занимались анализом эффективности разных стратегий в своей любимой настольной игре, это может зацепить нанимающего менеджера.
- Проявите энтузиазм. От вас не ждут исчерпывающих знаний. Любой опытный тимлид знает, что человека, который хочет работать и учиться новому, можно обучить чему угодно. А человека, который готов взять первое попавшееся место и не вовлечен, невозможно мотивировать никак. Ищите сферы и компании, которые вам действительно интересны, и показывайте свой энтузиазм. Изучите публикации о компании в медиа и соцсетях, попробуйте узнать больше о том, что происходит в индустрии в целом — и упомяните это на интервью.
- Будьте упорными. Рынок труда не идеален: иногда настоящие таланты не получают оффер с первой попытки. Для статистики — для нанимающих менеджеров в любой сфере считается большим успехом, если хотя бы треть нанятых сотрудников оправдали ожидания. Будьте упорными и не теряйте присутствия духа. Получать отказы эмоционально тяжело, но это временные трудности.