Os voicebots padrão incorporam IA apenas em termos de síntese e reconhecimento de fala. Isso funciona bem para casos como lembretes de compromisso, confirmações de pedidos e coleta de feedback simples.
Sintetiza a fala em 27 idiomas, fornece 197 opções de voz totais, 100 das quais são neurais. A tecnologia do Google é usada no Assistente Google, na Pesquisa Google e no Google Tradutor.
Oferece 116 opções de voz totais cobrindo 35 idiomas e 49 dialetos. Essas opções incluem 36 opções neurais com base na mais recente tecnologia de aprendizagem profunda.
Transforma texto em uma fala realista. O texto-para-fala da Polly abrange 18 idiomas e 58 opções de voz, incluindo 13 neurais.
Oferece 41 vozes com 19 opções neurais em 11 idiomas. A solução IBM Watson pode aprender a partir de conversas de clientes.
Usa modelos de rede neural profunda para reconhecimento e síntese de fala e é usado para criar um assistente financeiro de voz chamado Oleg. Está disponível em russo.
Permite que você reconheça ou fale qualquer texto em 3 idiomas. O SpeechKit é o que alimenta Alice, o assistente de voz da Yandex.
Às vezes, não é suficiente apenas capturar as palavras que os clientes dizem. Existem casos quando você precisa capturar as palavras-chave específicas a partir da fala, reconhecer a intenção do cliente e pedir informações ausentes. É quando você precisa de um voicebot de NLP avançado.
é adequado para conversas curtas e foi elogiado por sua simplicidade. O ES é frequentemente usado com aplicativos de voz nos quais uma expressão curta corresponde a uma intenção. Por exemplo, um aplicativo de voz de entrega de alimentos onde você pode dizer: "Eu gostaria de pedir uma pizza". O voicebot oferecerá as pizzas disponíveis, perguntará o tamanho, quantidade e endereço de entrega.
é um tipo de voicebot avançado, adequado para conversas complexas e longas ao longo de 10 minutos. O CX tem dois recursos principais: os voicebots podem transferir chamadas para agentes ao vivo e os usuários podem interromper os voicebots para que ele comece a ouvir novamente.
Uma interface clássica que não requer instalação de programas adicionais, embora não tenha flexibilidade. O SIP é limitado pelo protocolo RTP, então você precisa garantir que os dados que você troca com o seu bot são compatíveis com o RTP. Você pode se conectar com o voicebot IBM Watson usando o SIP
Uma opção mais flexível, compatível com todos os provedores de IA. Os WebSockets são avançados o suficiente para suportar transmissões de mídia, metadados e mensagens de controle no mesmo canal.
Uma das soluções líderes para voicebots é a Dialogflow do Google, e nós temos uma integração de um clique com ela. A Dialogflow é muitas vezes considerada a mais poderosa interface baseada em gRPC que permite que você reconheça as intenções do cliente.
por 15 segundos
por 10 caracteres
por 15 segundos
por 10 caracteres
Padrão
Melhorada
Padrão
WaveNet
por 15 segundos
por 10 caracteres
Padrão
Padrão
Neural
por 15 segundos
por 10 caracteres
Padrão
Padrão
Neural
por 15 segundos
por 10 caracteres
Padrão
Neural
por 15 segundos
por 10 caracteres
Padrão
Padrão
por 15 segundos
por 10 caracteres
Padrão
Padrão
Neural
por 15 segundos
por 10 caracteres
Até 1 milhão de caracteres
Mais de 1 milhão
por 15 segundos
por 10 minutos