Developer community

Полноценный Text-To-Speech для всех разговоров

  •  
    Iskander asked this on November 14, 2014 at 7:39 am

    Добрый день! Потестил возможности распознавания, впечетляет.
    Подскажите пожалуйста можно ли сделать распознавание звонка “На лету”?

    Как разговор в текст перевести более менее понятно, а как разделить абонентов?
    То есть слушать линию абонента, перевести в текст, слушать линию оперратора, перевести в текст.

    А чтобы это выстоилось в виде диалога?

    Пример: звонит клиент и хочет купить хлеб.
    1) Что говорили люди

    – Добрый, день, я хотел бы купить хлеб
    – Да, супер мы как раз его продаем
    – А черный есть?
    – Да черный у нас ест…
    – (перебивает и говорит одновременно) Стойте стойте, мне звонит жена, я перезвоню.

    2) Как расшифрует это система

    добрый день я хотел бы купить хлеб да супер мы как раз его продаем а черный есть да черный у нас стойте стойте стойте есть мне звонит жена я перезвоню

    Все ли я понял верно, система работает так? Если нет, то где можно почитать про это у вас, может быть есть готовые примеры кода? Про ошибку распознавания я знаю, семантический поиск и подбор подходящих по смыслу слов из базы пока не планирую делать, хотелось бы “черновик” получить сначала а потом уже его дорабатывать.

    Жду ответа, спасибо!

    Comments

  •  
    • admin

      Описанный вами сценарий пока нельзя реализовать с помощью текущих возможностей системы, такая возможность появится позже

      November 14, 2014 at 10:55 am
    •  
      • Iskander

        Когда позже? А какой сценарий сейчас можно реализовать? Просто распознавание, не по ролям можно?

        November 16, 2014 at 8:46 am
    •  
      • admin

        Сейчас есть несколько режимов распознавания одного потока аудио: адреса в России и определение слова из указанного словаря. Пример можно посмотреть тут http://habrahabr.ru/company/zingaya/blog/231319/

        November 16, 2014 at 10:51 am
    •  
      • Iskander

        А когда появится такая возможность? И можно ли загрузить словарь русских слов и распознавать слова из него? Такая фича критически важна, хотелось бы реализовать её именно на вашем сервисе

        November 20, 2014 at 12:04 pm
    •  
      • admin

        Сейчас можно распознавать слова из списка (ограниченного размера) в режиме IVR – когда человеку предлагают произнести какое-то слово или фразу, а потом система распознает и выдает вероятность.

        November 20, 2014 at 12:23 pm
    •  
      • Iskander

        Спасибо за ответ, почитал статью на хабре, разобрался. Другой вопрос, подскажите пожалуйста как можно разделить каналы для записей разговора? Чтобы отдельно записывался голос оператора и клиента?

        November 20, 2014 at 1:34 pm
    •  
      • admin

        Пока такого функционала нет, но мы планируем это реализовать в будущем.

        November 20, 2014 at 1:35 pm
 
Reply To: Полноценный Text-To-Speech для всех разговоров
Your information: