Соревнование для ML-специалистов: кто проводит и какие задачи решают

Фото: Freepik
Фото: Freepik
Центр Big Data МТС организовал состязания для специалистов по машинному обучению, чтобы поддержать IТ-специалистов и найти разработчиков в свою команду. Рассказываем о событии подробнее

Что происходит

  • Центр МТС Big Data провел соревнование для специалистов по машинному обучению. Участникам было необходимо по обезличенным данным определить возраст интернет-пользователей.
  • В мероприятии приняли участие более 2,2 тыс. ML-специалистов. Они объединились в 500 команд и представили 7 тыс. решений задачи.
  • Организаторы мероприятия преследовали три задачи: поддержать IT-специалистов, привлечь новых людей в техническую команду, посмотреть на нестандартные решения актуальной задачи и сравнить с собственными разработками.

Директор Big Data МТС Виктор Кантор:

«Успехи любого бизнеса держатся на людях, поэтому для нас критически важно инвестировать в развитие профессиональной среды. Соревнования по машинному обучению на реальных задачах из бизнеса помогают создавать дух здоровой конкуренции и привлекать в команду не просто хороших специалистов, а лучших на рынке».

  • Среди данных, которые могли использовать IT-специалисты на соревнованиях, — регион, населенный пункт, производитель, модель, тип, цена и операционная система устройства, домен, с которого пришел рекламный запрос, дата, время, число запросов и ID пользователя.
  • Организаторы предложили участникам примеры работающих моделей, чтобы начинающие специалисты в Data Science смогли разобраться в готовом решении, попробовать предложить свой вариант и не потерять мотивацию участвовать в соревновании.
  • В итоге победил ML-специалист Владимир Баженов, который преобразовывал словесные данные в набор чисел с помощью режима обучения Self-Supervised Learning. Режим не требует дополнительной разметки и формируется исходя из базовых знаний об объекте. Чтобы определить, насколько хорошо работает модель, участник использовал функцию потерь Additive Margin Softmax. Такой подход позволил объединять сайты, которые посещал пользователь, в группы и достаточно точно определять его возраст.
  • Призовой фонд конкурса составил 650 тыс. руб.: победитель получил 350 тыс. руб., 200 тыс. и 100 тыс. достались участникам, занявшим второе и третье место соответственно.

«Интересно было посмотреть на применение новых трансформерных архитектур, которые сейчас используются везде, в том числе в нашумевшем ChatGPT. По итогам мероприятия мы увидели множество интересных идей, которые можно будет попробовать использовать в продакшен-среде», — отметил Виктор Кантор.

Что это значит

Машинное обучение (ML) — это способ обучения на данных с помощью математических моделей и без конкретных инструкций. ML автоматизирует рутинные задачи, увеличивает производительность и снижает количество ошибок.

По данным аналитической компании Fortune Business Insights, мировой рынок технологий машинного обучения в 2021 году составил $15,44 млрд. Ожидается, что к 2029 году объем вырастет до $209,91 млрд.

Фото:Unsplash
Индустрия 4.0 Что такое машинное обучение и как оно работает

С помощью машинного обучения ИИ анализирует данные, запоминает информацию, строит прогнозы, воспроизводит готовые модели и выбирает наиболее подходящий вариант из предложенных.

Области применения ML разнообразны: например, расчет кредитного рейтинга, проведение маркетинговой, статистической и бизнес-аналитики, помощь в бизнес-планировании, поиске фейковых новостей и мошеннических сайтов, в настройке таргетированной рекламы, а также настройке персональных рекомендаций в сервисах и приложениях.

Обновлено 25.04.2023
Главная Лента Подписаться Поделиться
Закрыть