Google Duplex: Det nya AI-systemet som kan utföra verkliga världsuppgifter
News / / August 05, 2021
I år släpper Google några av de bästa av sina innovationer till allmänheten. De flesta av dess aktuella uppdateringar, verktyg och program är främst AI-centrerade. En av det är mycket intelligent och automatiserat system som kan ringa samtal och utför vissa uppgifter. Behovet av dators förmåga att förstå och utföra naturligt tal har lett till bildandet av Google Duplex.
Idag är vanliga automatiserade telefonsystem inte tillräckligt snabba för att känna igen grundläggande kommandon. De deltar inte i ett samtalsflöde och tvingar den som ringer att anpassa sig till systemet istället för att systemet anpassar sig till den som ringer. Det är här Duplex går in på scenen.
Google Duplex, mål för att utföra "verkliga" uppgifter via telefon. Det inkluderar att slutföra specifika uppgifter, till exempel schemalägga möten eller boka bord i restaurangen. För detta gör det automatiska systemet en naturlig konversation med restaurangrepresentanten via telefon. En annan fördel är att Duplex möjliggör asynkron kommunikation med tjänsteleverantörer. Google Duplex kan begära möten under öppen tid, och även med begränsad anslutning.
Det främjar också tillgänglighet och hjälper till att övervinna språkbarriärer. Det betyder att det hjälper ljudskadade användare att boka en tid. Även användare som kanske inte talar det lokala språket kan utföra uppgifter via telefon.
Du kan till exempel se hur Google Duplex ringer till restaurangen för att boka plats. Här är ett ljudprov för detsamma. Se hur det klart, till pint och övergripande naturliga.
I ett naturligt samtal pratar folk vanligtvis med mindre tydlighet. Det finns pauser, utelämningar tillsammans med enstaka bakgrundsljud. Om det nu är en människa-till-människa-konvo kommer detta att vara något naturligt anpassningsbart och konversationen förbättras. Men tänk om dess mänskliga till maskin-konvo då fel i konversationen och taligenkänning kan vara svårt beroende på olika faktorer.
Så här fungerar Google Duplex.
Google Duplex kan genomföra komplexa samtal och utföra uppgifter helt autonomt. Det finns absolut inget mänskligt engagemang. Systemet har en självövervakningsfunktion som gör det möjligt att känna igen de uppgifter som det inte kan slutföra autonomt. I dessa fall signalerar den till en mänsklig användare att slutföra uppgiften.
Duplexen har en kärna för neuralt nätverk som använder utgången från Googles automatiska taligenkänning (ASR). Det hänvisar också till samt funktioner från ljudet, historien och begränsningarna för konversationen. Den använder en kombination av en text-till-tal-motor (TTS) och en syntesmotor för att styra intonationen beroende på situationen. Duplex handling är mer naturlig på grund av användningen av talstörningar som att säga "hmm" eller "uhh".
Här är ett exempel på hur duplex kan svara på avbrott.
Titta igen hur det kan ge ett smart svar.
Ingenjörer förväntar sig snart att starta Duplex genom att integrera med Google Assistant de närmaste dagarna.
Detta är en av de största prestationerna under Googles läger i år för att få ett mer mänskligt gränssnitt som kan hjälpa användare att enkelt utföra olika uppgifter. Så låt oss vänta och titta på lanseringen av Google duplex de närmaste dagarna.
Källa
Swayam är en professionell teknisk bloggare med magisterexamen i datorprogram och har också erfarenhet av Android-utveckling. Han är en stark beundrare av Stock Android OS, förutom teknisk bloggning, han älskar att spela, resa och spela / undervisa gitarr.