Предсказать будущее на 8 секунд
Как российский дата-сайнтист решал одну из самых важных задач в индустрии автономного вождения.
Кирилл Бродт — молодой ученый, аспирант университета Монреаля и сотрудник центра искусственного интеллекта МТС. Его команда заняла третье место в Waymo Motion Prediction Challenge – престижном международном соревновании дата-сайнтистов, которые развивают проекты в области компьютерного зрения и предиктивной аналитики. В нем принимали участие 19 команд из разных стран. Победители создали наиболее точные модели, которые прогнозируют поведение участников дорожного движения. Как команда Кирилла решала одну из ключевых задач индустрии автономного вождения, расскажем в этой статье.
Беспилотный проект Waymo – дочерняя компания холдинга Alphabet Inc (Google), один из мировых лидеров в области разработки беспилотных автомобилей. С октября 2020 года роботакси Waymo совершают коммерческие поездки без водителей-испытателей за рулем. Waymo управляет коммерческим сервисом беспилотных такси Waymo One, который работает в Аризоне.
Любой водитель должен понимать, что собираются делать окружающие его участники дорожного движения. Этот пешеход пытается перейти улицу? Эта машина припаркована параллельно или вот-вот свернет на мою полосу? Остановится ли этот мчащийся автомобиль у знака «Стоп»? Правильная оценка вероятного поведения других водителей также важна для безопасности и безаварийной езды.
Прогнозирование действий других участников дорожного движения – один из самых важных вопросов для развития индустрии автономного вождения. Сейчас он находится в стадии активного исследования. Чтобы сделать большой шаг вперед в индустрии беспилотного транспорта, достаточно с высокой степенью точности предсказать, где окажутся другие автомобили и участники дорожного движения в ближайшие несколько секунд. Придумать, как это сделать, компания Waymo предложила в рамках международного соревнования Waymo Motion Prediction Challenge. Суть задания состояла в том, чтобы, наблюдая за участниками дорожного движения в течение одной секунды, предсказать их действия в течение следующих восьми секунд. При этом речь шла не об одном перекрестке, масштаб решения - город в США.
Два миллиона кадров для точного прогноза
Над решением этой задачи работали порядка 20 команд из разных стран. В команде Кирилла также были Степан Конев из Сколтеха и Артём Санакоев из университета Гейдельберга. У ребят было 2 недели на то, чтобы разработать свой подход.
«Сложность была в том, что исходные данные представляли из себя большую таблицу с многочисленными параметрами, такими как положение объектов (дорожные полосы, светофоры) и агентов (автомобили, велосипедисты и пешеходы), включая их скорости, угловые скорости и направления. Чтобы решить задачу, нам нужно было сначала представить эти данные в удобном виде, – рассказывает Кирилл. – Мы провели растеризацию, то есть нанесли дорожную карту и положения всех объектов на изображение, кодируя их историю дополнительными каналами. Другими словами, превратили табличные данные в картинки, именно это стало самой трудоемкой частью решения. Это позволило получить вид сверху, понятный для человека. Далее мы применили свёрточные нейронные сети, которые отлично подходят для изображений и предсказали