«Яндекс» опубликовал уникальный датасет для обучения беспилотников
Что происходит
- «Яндекс» разработал и опубликовал датасет для обучения алгоритмов предсказания движения транспортных средств и пешеходов. В него входят данные, эквивалентные 69 часам беспрерывной езды, — это крупнейший подобный датасет в мире.
- Он состоит из 600 сцен длиной по 10 секунд, каждая из которых представляет собой карту местности с разметкой, нанесенных на карту машин, пешеходов и светофоров, а также указанием параметров подвижных объектов и погодных условий.
- Разработчики преследовали цель подготовить нейросеть к сдвигу распределения данных, — когда модель попадает в незнакомые ей ситуации, потому что она не видела подобные данные и не знает, как себя вести. Именно поэтому «Яндекс» собирал информацию в странах с разными погодными условиями и стилями вождения — России, Израиле и США.
- Кроме того, команда «Яндекса» хочет научить алгоритм давать оценку неопределенности относительно своих решений, тем самым увеличив его эффективность.
- Вместе с коллегами из Кембриджского и Оксфордского университетов «Яндекс» анонсировал конкурс Shifts Challenge по созданию алгоритмов предсказания движения машин и пешеходов. Суть задания заключается в следующем: на основе первых пяти секунд из сцены датасета предсказать движение всех объектов в следующие пять секунд, а также оценить неопределенность прогноза.
Что это значит
Логические алгоритмы, применяемые в беспилотных автомобилях, в настоящее время не настолько разработаны, как алгоритмы восприятия среды. В то же время, именно они отвечают за прогнозирования ситуации и помогают проложить безопасный путь движения. Разработка нейросетей, отвечающих за «логику» беспилотника, — задача не из простых, в первую очередь из-за так называемого сдвига распределения.
«Сдвиг» стиля вождения и некоторых правил — это то, что люди умеют учитывать. Для машинного обучения это серьезный вызов: обучить алгоритм так, чтобы в ситуации, которая далека от обучающей выборки, выдать не совсем бредовый прогноз, правильно учесть сдвиг относительно обучающей выборки. Например, если модель учили на выборке, где на круговом движении все пропускают движущихся по кругу, она не должна спровоцировать ДТП или впасть в ступор в стране, где это правило игнорируют», — прокомментировал новость директор по стратегическому маркетингу сервисов «Яндекса» Андрей Себрант в своем телеграмм-канале.
Стоит отметить, что количество локаций для тестирования беспилотников большинства разработчиков весьма ограничено. Таким образом, при столкновении с абсолютно новыми условиями вождения, вероятность принятия алгоритмом неправильного решения из-за сдвига распределения увеличивается. Именно поэтому так важно обучить нейросеть применять в новых условиях уже накопленный опыт и на его основе прогнозировать развитие дорожной ситуации с минимальной погрешностью.