GPT повсеместно применяется в разметке данных для дальнейшего обучения ML‑моделей. Это упрощает работу исполнителей и повышает качество разметки, рассказал CSA в Yandex Crowd Solutions Герман Ганус на конференции AI Conf в сентябре 2024 года.
По его словам, простую разметку уже полностью выполняет искусственный интеллект. В более сложных задачах GPT используют для машинной предразметки или для формулировки саджестов — гипотез о финальном результате от модели. И за этим — будущее.
Но в применении GPT есть нюансы, предупредил Герман. Например, саджесты несут риск смещения результатов. Поэтому важно выбрать верный подход к промпт‑инжинирингу.
Стратегии промт‑инженеров:
Zero-Shot Prompting
Применяется для простых задач или когда сложно составить пример
One-Shot Prompting
Используется для задач, где все особенности желаемого ответа можно показать в одном примере
Few-Shot Prompting
Подходит для более сложных задач классификации, где необходимо несколько примеров для демонстрации желаемого результата
Подходит для более сложных задач классификации, где необходимо несколько примеров для демонстрации желаемого результата
Промт-инжиниринг — трудоёмкая задача. Но её можно поручить редакторам-краудсорсерам, напомнил Герман. В Yandex Crowd Solution есть такие специалисты и технологии контроля качества их работы.
Качество GPT-разметки зависит ещё и от качества данных. Технический менеджер Yandex Crowd Solutions Олег Секачёв на AI Conf провёл мастер-класс для тех, кому нужны действительно работающие датасеты. Участники создавали проекты по разметке данных на платформе Яндекс Задания и налаживали контроль за качеством результата — в конце даже обучили модель Yolov на полученных данных.
Узнайте подробнее, как работает краудсорсинг на примере сбора и разметки данных.
Вернуться к новостям
Поделиться
Кейсы и новости по теме
Как составить эффективный промпт для нейросети
Мастер-класс от Yandex Crowd на всероссийском форуме
Как нейросети делают разметку проще и быстрее
Три истории, которые мы рассказали на Data Fest 2025
Как сделать разметку данных более точной, быстрой и дешёвой
Раскрыли фирменный рецепт оптимизации c помощью искусственного интеллекта