Заказчики: MySkazka Подрядчики: Группа компаний ЦРТ (Центр речевых технологий) Дата проекта: 2020/08 — 2020/11
|
2020: Озвучивание сказок
Синтез речи группы компаний ЦРТ (входит в экосистему Сбера) теперь используют для озвучивания детских сказок на сервисе MySkazka. Об этом стало известно 26 ноября 2020 года. При помощи технологии было озвучено 10 сказок, которые можно воспроизводить женским и мужским голосом.
Синтез речи — это технология перевода печатного текста в звучащую речь. В группе ЦРТ эту технологию создают на стеке методов глубинного обучения, что позволяет добиться высокого качества синтезированного голоса.
Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ, отметил:
Особенность синтеза ЦРТ — в использовании сложных нейросетевых моделей для непрерывной генерации речевого аудиосигнала по тексту, глубокий синтаксический и лексический анализ текста, моделирование интонаций, возможность моделирования дыхания. Это позволяет добиться плавности и выразительности искусственной речи, сделать речь более реалистичной. Синтез группы ЦРТ работает в составе сложных продуктов и AI-решений в различных отраслях по всей стране: в банках, телеком, медицине и др. Совместный проект по интеграции синтеза в проект MySkazka — особый для нас, поскольку связан с самой юной аудиторией и мы рады поддержать его. Уверен, что проект будет развиваться. |
Проект был запущен в конце августа 2020 года, тогда встал вопрос о реализации озвучки сказок.
Иван Глушков, Co-founder MySkazka.com, рассказал:
Перед нами стояла трудная задача, так как в работе сервиса используются персональные переменные, которые пользователь заполняет в реальном времени. Поэтому простой вариант — озвучить наши сказки с помощью профессионального диктора, нам не подошел. Мы начали искать технологическое решение и выбрали синтез группы ЦРТ: для нас было важно не просто синтезировать речь из текстов сказок, но сделать её максимально похожей на настоящую — с интонацией, придыханием, знаками препинания, ведь целевая аудитория сервиса MySkazka — дети. Озвучивание сказок с помощью синтеза позволит пользоваться сервисом детям, которые еще не умеют читать или испытывают специфические трудности с чтением, а также тем, кто предпочитает формат аудиокниг. Озвучка работает всего неделю, но мы уже наблюдаем положительную динамику — Retention rate сервиса (коэффициент удержания пользователей) вырос на 30%, а конверсия новых пользователей в регистрации увеличилась с 7 до 11%. |