Google Duplex: o novo sistema de IA que pode executar tarefas do mundo real
Notícia / / August 05, 2021
Este ano, o Google está lançando algumas das melhores de suas inovações ao público. A maioria de suas atualizações, ferramentas e programas atuais são principalmente centrados em IA. Um deles é um sistema altamente inteligente e automatizado que pode fazer ligações e realizar determinadas tarefas. A necessidade da capacidade dos computadores de compreender e executar a fala natural levou à formação do Google Duplex.
Hoje, os sistemas telefônicos automatizados regulares não são rápidos o suficiente para reconhecer comandos básicos. Eles não se envolvem em um fluxo de conversa e forçam o chamador a se ajustar ao sistema em vez de o sistema se ajustar ao chamador. É aqui que o Duplex entra em cena.
Google Duplex, visa realizar tarefas do “mundo real” pelo telefone. Inclui a realização de tarefas específicas, como agendar compromissos ou reservar mesas no restaurante. Para isso, o sistema automático faz uma conversa natural com o representante do restaurante ao telefone. Outra vantagem é que o Duplex permite a comunicação assíncrona com os provedores de serviço. O Google Duplex pode solicitar compromissos fora do horário comercial e até mesmo com conectividade limitada.
Também promove a acessibilidade e ajuda a superar as barreiras linguísticas. Isso significa que ajuda os usuários com deficiência de áudio a marcar uma consulta. Mesmo os usuários que não falam o idioma local podem executar tarefas pelo telefone.
Você pode, por exemplo, ver como o Google Duplex está fazendo uma ligação para o restaurante para reservar um lugar. Aqui está uma amostra de áudio para o mesmo. Veja como é claro, ao pint e natural em geral.
Normalmente, em uma conversa natural, as pessoas falam com menos clareza. Há pausas, omissões acompanhadas de ruídos de fundo ocasionais. Agora, se for uma conversa de humano para humano, isso será algo naturalmente adaptativo e a conversa será melhorada. Mas imagine se houver conversão de humano para máquina, os erros na conversação e no reconhecimento de voz podem ser difíceis, dependendo de vários fatores.
É assim que o Google Duplex funciona.
O Google Duplex pode realizar conversas complexas e executar tarefas de forma totalmente autônoma. Não há absolutamente nenhum envolvimento humano. O sistema tem uma capacidade de automonitoramento, que permite reconhecer as tarefas que não pode realizar de forma autônoma. Nestes casos, ele sinaliza para um usuário humano, para concluir a tarefa.
O Duplex tem um núcleo de rede neural que usa a saída do reconhecimento automático de fala (ASR) do Google. Também se refere aos recursos do áudio, ao histórico e às restrições da conversa. Ele usa uma combinação de um mecanismo de texto para fala (TTS) e um mecanismo de síntese para controlar a entonação dependendo da situação. A ação do Duplex é mais natural devido ao uso de disfluências de fala, como dizer "hmm" ou "uhh".
Aqui está um exemplo de como o duplex pode responder a interrupções.
Mais uma vez, observe como ele pode fornecer uma resposta inteligente.
Em breve, os engenheiros esperam lançar o Duplex integrando-se ao Google Assistant nos próximos dias.
Esta é uma das maiores conquistas da equipe do Google este ano, trazer uma interface mais humana que pode ajudar os usuários a realizar várias tarefas com facilidade Então, vamos esperar e assistir ao lançamento do Google duplex nos próximos dias.
Fonte
Swayam é um blogueiro profissional de tecnologia com mestrado em aplicativos de computador e também tem experiência com desenvolvimento Android. Ele é um grande admirador do Stock Android OS. Além dos blogs de tecnologia, ele adora jogar, viajar e tocar / ensinar guitarra.