SIGN UP

Developer community

Community Support / General questions

Полноценный Text-To-Speech для всех разговоров

Iskander
Добрый день! Потестил возможности распознавания, впечетляет. Подскажите пожалуйста можно ли сделать распознавание звонка "На лету"? Как разговор в текст перевести более менее понятно, а как разделить абонентов? То есть слушать линию абонента, перевести в текст, слушать линию оперратора, перевести в текст. А чтобы это выстоилось в виде диалога? Пример: звонит клиент и хочет купить хлеб. 1) Что говорили люди - Добрый, день, я хотел бы купить хлеб - Да, супер мы как раз его продаем - А черный есть? - Да черный у нас ест... - (перебивает и говорит одновременно) Стойте стойте, мне звонит жена, я перезвоню. 2) Как расшифрует это система добрый день я хотел бы купить хлеб да супер мы как раз его продаем а черный есть да черный у нас стойте стойте стойте есть мне звонит жена я перезвоню Все ли я понял верно, система работает так? Если нет, то где можно почитать про это у вас, может быть есть готовые примеры кода? Про ошибку распознавания я знаю, семантический поиск и подбор подходящих по смыслу слов из базы пока не планирую делать, хотелось бы "черновик" получить сначала а потом уже его дорабатывать. Жду ответа, спасибо!

Answers (4)

admin
Описанный вами сценарий пока нельзя реализовать с помощью текущих возможностей системы, такая возможность появится позже
Iskander
Когда позже? А какой сценарий сейчас можно реализовать? Просто распознавание, не по ролям можно?
admin
Сейчас есть несколько режимов распознавания одного потока аудио: адреса в России и определение слова из указанного словаря. Пример можно посмотреть тут http://habrahabr.ru/company/zingaya/blog/231319/
Iskander
А когда появится такая возможность? И можно ли загрузить словарь русских слов и распознавать слова из него? Такая фича критически важна, хотелось бы реализовать её именно на вашем сервисе
admin
Сейчас можно распознавать слова из списка (ограниченного размера) в режиме IVR - когда человеку предлагают произнести какое-то слово или фразу, а потом система распознает и выдает вероятность.
Iskander
Спасибо за ответ, почитал статью на хабре, разобрался. Другой вопрос, подскажите пожалуйста как можно разделить каналы для записей разговора? Чтобы отдельно записывался голос оператора и клиента?
admin
Пока такого функционала нет, но мы планируем это реализовать в будущем.
Денис
Текущий функционал уже разработали?
admin
Да, распознавание речи уже доступно http://voximplant.com/blog/speech-to-text-asr/
Денис
На сколько процентов речь распознается верно? Чей софт используете?

Add your comment

Please, enter valid email

Get your free developer account or talk with our sales team to learn more about Voximplant solutions
SIGN UP
Contact sales

Please complete this field.

Please complete this field.

Please complete this field.

Choose the solution

Please complete this field.

Please complete this field.