Новости

Кто научил Алису понимать людей с нарушениями речи

2 минуты
26 апреля 2025
У многих, кто перенёс инсульт, речь становится менее внятной. Яндексу с помощью краудсорсинга удалось научить голосового помощника Алису лучше понимать этих людей. Как это было, рассказал руководитель группы проектов Алисы и международных разметок Yandex Crowd Solutions Дмитрий Кукулиди на конференции «Merge Татарстан 2025».
Чтобы Алиса лучше распознавала команды, предстояло собрать и обработать голосовые запросы людей, имеющих сложности с произношением — готового русскоязычного датасета не было.
Команда Yandex Crowd Solutions нашла более 300 человек с нарушениями речи и записала с ними 900 часов аудиозаписей. А потом классифицировала речевые дефекты, чтобы разработчики Алисы смогли эффективно её обучить, рассказал Дмитрий.
В результате при лёгкой и средней формах нарушений Алиса стала распознавать речь не хуже человека, а при тяжёлой — даже лучше!
Word Error Rate (WER), то есть доля неправильно распознанных слов, в запросах от людей с нарушениями произношения сократилась:

на 16,4%

при лёгкой форме

на 20,7%

при средней форме

на 23,1%

при тяжёлой форме
Такой результат был бы невозможен без использования краудсорсинговой платформы Яндекс Задания, привлечения дефектологов и контроля качества разметки данных, подчеркнул Дмитрий.
Узнайте подробности этого проекта.
Поделиться
Кейсы и новости по теме

Помогли Алисе лучше распознавать особенную речь

Собрали датасет из 900 часов аудиозаписей для дообучения модели

Какие тренды меняют разметку данных в 2025 году

Объяснили, как новые технологии позволяют быстрее и дешевле обрабатывать датасеты

Как научить модель исправлять ошибки

Собрали датасет из 5000 текстов и разметили в них погрешности для YandexGPT

Расскажите о задаче

Есть идея для совместного проекта? Нужна помощь в обучении ML-модели
или данные для бизнеса?
Мы готовы помочь!
Fri Dec 26 2025 15:59:58 GMT+0300 (Moscow Standard Time)