У многих, кто перенёс инсульт, речь становится менее внятной. Яндексу с помощью краудсорсинга удалось научить голосового помощника Алису лучше понимать этих людей. Как это было, рассказал руководитель группы проектов Алисы и международных разметок Yandex Crowd Solutions Дмитрий Кукулиди на конференции «Merge Татарстан 2025».
Чтобы Алиса лучше распознавала команды, предстояло собрать и обработать голосовые запросы людей, имеющих сложности с произношением — готового русскоязычного датасета не было.
Команда Yandex Crowd Solutions нашла более 300 человек с нарушениями речи и записала с ними 900 часов аудиозаписей. А потом классифицировала речевые дефекты, чтобы разработчики Алисы смогли эффективно её обучить, рассказал Дмитрий.
В результате при лёгкой и средней формах нарушений Алиса стала распознавать речь не хуже человека, а при тяжёлой — даже лучше!
Word Error Rate (WER), то есть доля неправильно распознанных слов, в запросах от людей с нарушениями произношения сократилась:
на 16,4%
при лёгкой форме
на 20,7%
при средней форме
на 23,1%
при тяжёлой форме
Такой результат был бы невозможен без использования краудсорсинговой платформы Яндекс Задания, привлечения дефектологов и контроля качества разметки данных, подчеркнул Дмитрий.
Узнайте подробности этого проекта.
Вернуться к новостям
Поделиться
Кейсы и новости по теме
Помогли Алисе лучше распознавать особенную речь
Собрали датасет из 900 часов аудиозаписей для дообучения модели
Какие тренды меняют разметку данных в 2025 году
Объяснили, как новые технологии позволяют быстрее и дешевле обрабатывать датасеты
Как научить модель исправлять ошибки
Собрали датасет из 5000 текстов и разметили в них погрешности для YandexGPT