Новости

Как оптимизировать разметку без потери качества

3 минуты
16 сентября 2025
Предварительная разметка с помощью AI изменила процесс обучения автономного транспорта. Теперь мы делаем это быстрее и дешевле. Как именно, рассказал наш Crowd Solutions Architect (CSA) Максим Ермакович на митапе по разметке данных A&Y LabelTalk.

Фильтрация данных для роботакси

Чтобы автономные машины Яндекса ездили безопасно, их нужно многому научить. В том числе показать, как действовать в неидеальных условиях — когда стёрта разметка, перекрыта полоса или на дороге лежит мусор.
Задача Yandex Crowd Solutions — выделить на видео с камер автономных такси фрагменты со сложными условиями и классифицировать их.
Раньше для этого наши исполнители отсматривали тысячи часов таких записей. Но на 80% времени там ничего не происходит. Поэтому мы изменили процесс. Теперь ролики изучает VLM и сама находит нужные эпизоды. Задача человека — проверить, верно ли модель определила дорожную ситуацию и правильно ли её разметила.
Так получается на 70% быстрее и дешевле.
Узнайте подробнее, как Yandex Crowd Solutions помогает обучать автономный транспорт Яндекса.

Предразметка для роверов

Хотя роботы-доставщики уже доставляют заказы, они продолжают учиться. И тоже делают это на данных от Yandex Crowd Solutions.
Наши исполнители размечают данные с роверов, чтобы те чётко понимали: где дорога, тротуар и пешеходный переход, а где идут люди и движутся машины.
В 2025 году мы усовершенствовали процесс: доработали интерфейс внутренней платформы и внедрили предразметку: исполнитель теперь не отрисовывает объекты с нуля, а редактирует контуры, уже предложенные нейросетью.
Теперь выдаём результат в 2,5 раза быстрее и дешевле.

Несколько фактов о A&Y LabelTalk

фото
фото
  • Помимо Яндекса и Альфа-Банка в митапе участвовали коллеги из Сбера, Т-Банка, MWS AI, Data Light, LLMARENA, Ozon и AliExpress. Было обсуждение трендов, обмен эффективными практиками, поиск общих решений и много нетворкинга.
  • Модератором и ведущим митапа выступил руководитель службы разметки данных Yandex Crowd Solutions Дмитрий Пименов.
  • Также с докладом выступила наш операционный руководитель Арина Ямалеева. Она рассказала, что несмотря на автоматизацию, мы не сократили команду, а в 8 раз увеличили темпы привлечения исполнителей за последние 2 года. Сейчас на наших проектах задействовано более 160 000 человек. Автоматизация рутины позволяет людям решать более сложные и творческие задачи, а нам — масштабировать проекты с невероятной скоростью.
Поделиться
Кейсы и новости по теме

Учим автомобили Яндекса ездить без водителя

Разметили данные, чтобы сделать автономный транспорт безопаснее

Как заменить ручной труд с помощью GenAI

Потренировались с коллегами из ведущих IT‑компаний

Как мы помогаем обучать нейросеть YandexART

Для этого разметили 14 млн изображений с 2023 года

Расскажите о задаче

Есть идея для совместного проекта? Нужна помощь в обучении ML-модели
или данные для бизнеса?
Мы готовы помочь!
Mon Oct 06 2025 15:39:35 GMT+0300 (Moscow Standard Time)