Новости

Как мы научили разметке данных студентов ВШЭ

6 минут
10 декабря 2025

Эксперты из Yandex Crowd Solutions впервые провели для студентов Высшей школы экономики курс «Сбор и разметка данных для машинного обучения»

Занятия прошли на факультете компьютерных наук, который был основан ВШЭ в 2014 году в партнерстве с Яндексом.
Студенты познакомились с актуальными технологиями разметки данных и разобрали их применение на реальных кейсах Яндекса. В итоге — научились готовить качественные датасеты для ML‑моделей, лежащих в основе работы множества приложений и сервисов.

О партнерстве с ВШЭ

Среди направлений сотрудничества факультета компьютерных наук (ФКН) НИУ ВШЭ и Яндекса — подготовка разработчиков и специалистов по ИИ и машинному обучению, исследования в области компьютерных наук и ИИ. Благодаря поддержке Яндекса на факультете основаны научно-учебная лаборатория методов анализа больших данных LAMBDA и лаборатория Яндекса. Для студентов ФКН, занимающихся исследовательской деятельностью, действует стипендия Яндекса.
За 11 лет сотрудничества выпускниками ФКН стали 5255 человек. Они работают в ведущих российских IT‑компаниях, запускают стартапы и занимаются исследованиями.
Курс «Сбор и разметка данных для машинного обучения», разработанный с участием экспертов Yandex Crowd Solutions и проведенный в ВШЭ осенью 2024 года, входит в программу магистратуры «Современные компьютерные науки» — ее ВШЭ реализует при поддержке Яндекса.

Задачи от Yandex Crowd Solutions помогают студентам закрепить знания на практике

Курс, организованный в онлайн‑ и офлайн‑форматах, включал семь лекций и семь семинаров, а также три домашних задания.
На занятиях лекторы из Yandex Crowd Solutions поделились экспертизой в сфере разметки данных:
  • работа с данными в машинном обучении
  • дизайн конвейера сбора и обработки данных, его автоматизация
  • этапы и инструменты контроля качества разметки
  • human-in-the-loop и другие варианты полуавтоматизированной разметки
  • актуальные подходы к оптимизации бюджета и процессов разметки
  • оценка качества работы модели и сбор данных для дообучения
В практическую часть курса вошли кейсы, рассматривающие работу с данными в Поиске, Алисе, Переводчике и других сервисах Яндекса. Практические задания студенты выполняли на платформе Яндекс Задания, взаимодействуя с исполнителями этой краудсорсинговой платформы.
Финальным домашним заданием стала защита проекта с презентацией собственных решений. Студентам необходимо было обучить классификатор, который по спутниковым снимкам определяет вид дерева: хвойное или лиственное. Для этого участники курса разметили данные и использовали их для обучения ML‑модели. Защиту итоговых проектов оценивали архитекторы краудсорсинговых решений Yandex Crowd Solutions.

Курс завершен, сотрудничество с ВШЭ продолжается

Обучение на курсе в ВШЭ осенью 2024 года прошли 28 студентов, 24 из которых показали хорошие результаты. Выпускники освоили весь цикл работы с данными и научились применять технологии разметки на практике.
В ближайшие годы сотрудничество Яндекса и ФКН ВШЭ планируется развивать по нескольким направлениям, среди которых создание новых образовательных программ, исследования в сфере ИИ, применение генеративных нейросетей в учебном процессе и междисциплинарные программы по IT‑направлениям для студентов социогуманитарных специальностей. Кроме того, с 2024 года совместно с Яндексом проходит международная олимпиада по искусственному интеллекту и анализу данных AIDAO.
Современным технологиям разметки данных эксперты Yandex Crowd Solutions также обучают в Школе анализа данных.
Поделиться
Кейсы и новости по теме
28 июля 2025

Учим студентов особенностям разметки

Разработали курс для Школы анализа данных Яндекса
21 октября 2025

Рассказали на Хабре, как разметили 12 000 квартир

Добились идеальной точности, чтобы на Яндекс Недвижимости заработали 3D‑туры

LLM + Краудсорсинг: секреты эффективной  разметки данных

Вебинар Yandex Crowd Solutions и Yandex Cloud

Расскажите о задаче

Есть идея для совместного проекта? Нужна помощь в обучении ML-модели
или данные для бизнеса?
Мы готовы помочь!
Fri Dec 26 2025 15:59:00 GMT+0300 (Moscow Standard Time)