Предварительная разметка с помощью AI изменила процесс обучения автономного транспорта. Теперь мы делаем это быстрее и дешевле. Как именно, рассказал наш Crowd Solutions Architect (CSA) Максим Ермакович на митапе по разметке данных A&Y LabelTalk.
Фильтрация данных для роботакси
Чтобы автономные машины Яндекса ездили безопасно, их нужно многому научить. В том числе показать, как действовать в неидеальных условиях — когда стёрта разметка, перекрыта полоса или на дороге лежит мусор.
Задача Yandex Crowd Solutions — выделить на видео с камер автономных такси фрагменты со сложными условиями и классифицировать их.
Раньше для этого наши исполнители отсматривали тысячи часов таких записей. Но на 80% времени там ничего не происходит. Поэтому мы изменили процесс. Теперь ролики изучает VLM и сама находит нужные эпизоды. Задача человека — проверить, верно ли модель определила дорожную ситуацию и правильно ли её разметила.
Так получается на 70% быстрее и дешевле.
Узнайте подробнее, как Yandex Crowd Solutions помогает обучать автономный транспорт Яндекса.
Предразметка для роверов
Хотя роботы-доставщики уже доставляют заказы, они продолжают учиться. И тоже делают это на данных от Yandex Crowd Solutions.
Наши исполнители размечают данные с роверов, чтобы те чётко понимали: где дорога, тротуар и пешеходный переход, а где идут люди и движутся машины.
В 2025 году мы усовершенствовали процесс: доработали интерфейс внутренней платформы и внедрили предразметку: исполнитель теперь не отрисовывает объекты с нуля, а редактирует контуры, уже предложенные нейросетью.
Теперь выдаём результат в 2,5 раза быстрее и дешевле.
Несколько фактов о A&Y LabelTalk
- Помимо Яндекса и Альфа-Банка в митапе участвовали коллеги из Сбера, Т-Банка, MWS AI, Data Light, LLMARENA, Ozon и AliExpress. Было обсуждение трендов, обмен эффективными практиками, поиск общих решений и много нетворкинга.
- Модератором и ведущим митапа выступил руководитель службы разметки данных Yandex Crowd Solutions Дмитрий Пименов.
- Также с докладом выступила наш операционный руководитель Арина Ямалеева. Она рассказала, что несмотря на автоматизацию, мы не сократили команду, а в 8 раз увеличили темпы привлечения исполнителей за последние 2 года. Сейчас на наших проектах задействовано более 160 000 человек. Автоматизация рутины позволяет людям решать более сложные и творческие задачи, а нам — масштабировать проекты с невероятной скоростью.
Вернуться к новостям
Поделиться
Кейсы и новости по теме
Учим автомобили Яндекса ездить без водителя
Разметили данные, чтобы сделать автономный транспорт безопаснее
Как мы помогаем обучать нейросеть YandexART
Для этого разметили 14 млн изображений с 2023 года