Google Duplex: het nieuwe AI-systeem dat taken uit de echte wereld kan uitvoeren
Nieuws / / August 05, 2021
Dit jaar laat Google enkele van de beste innovaties aan het publiek zien. De meeste van de huidige updates, tools en programma's zijn voornamelijk AI-gericht. Een daarvan is een zeer intelligent en geautomatiseerd systeem dat kan bellen en bepaalde taken kan uitvoeren. De behoefte aan het vermogen van computers om natuurlijke spraak te begrijpen en uit te voeren, heeft geleid tot de oprichting van Google Duplex.
Tegenwoordig zijn gewone geautomatiseerde telefoonsystemen niet prompt genoeg om basiscommando's te herkennen. Ze gaan niet in gesprek en dwingen de beller om zich aan het systeem aan te passen in plaats van dat het systeem zich aanpast aan de beller. Dit is waar Duplex in beeld komt.
Google Duplex, richt zich op het uitvoeren van "echte wereld" taken via de telefoon. Het omvat het voltooien van specifieke taken, zoals het plannen van afspraken of het reserveren van tafels in het restaurant. Hiervoor maakt het automatische systeem een natuurlijk gesprek met de restaurantvertegenwoordiger via de telefoon. Een ander voordeel is dat Duplex asynchrone communicatie met serviceproviders mogelijk maakt. Google Duplex kan buiten kantooruren en zelfs met beperkte connectiviteit afspraken aanvragen.
Het bevordert ook de toegankelijkheid en helpt taalbarrières te overwinnen. Dit betekent dat het gebruikers met een auditieve beperking helpt bij het maken van een afspraak. Zelfs gebruikers die de lokale taal niet spreken, kunnen taken uitvoeren via de telefoon.
U kunt bijvoorbeeld zien hoe Google Duplex naar het restaurant belt om een stoel te reserveren. Hier is een audiovoorbeeld voor hetzelfde. Zie hoe het duidelijk, tot de pint en over het algemeen natuurlijk is.
Meestal praten mensen in een natuurlijk gesprek met minder duidelijkheid. Er zijn pauzes, weglatingen en af en toe achtergrondgeluiden. Als het nu een mens-tot-mens convo is, zal dit enigszins van nature adaptief zijn en wordt het gesprek verbeterd. Maar stel je voor dat als het van mens tot machine convo is, fouten in het gesprek en spraakherkenning moeilijk kunnen zijn, afhankelijk van verschillende factoren.
Dit is hoe Google Duplex werkt.
Google Duplex kan complexe gesprekken voeren en voert taken volledig autonoom uit. Er is absoluut geen menselijke tussenkomst. Het systeem heeft een zelfcontrolerend vermogen, waardoor het de taken kan herkennen die het niet autonoom kan uitvoeren. In deze gevallen geeft het een menselijke gebruiker een signaal om de taak te voltooien.
De Duplex heeft een neurale netwerkkern die gebruikmaakt van de output van Google’s automatische spraakherkenning (ASR). Het verwijst ook naar functies van de audio, de geschiedenis en beperkingen van het gesprek. Het gebruikt een combinatie van een tekst-naar-spraak-engine (TTS) en een synthese-engine om de intonatie te regelen, afhankelijk van de situatie. De actie van Duplex is natuurlijker vanwege het gebruik van onvloeiend spraakgebruik, zoals 'hmm' of 'uhh' zeggen.
Hier is een voorbeeld van hoe duplex kan reageren op onderbrekingen.
Kijk nogmaals hoe het een slim antwoord kan geven.
Ingenieurs verwachten binnenkort Duplex te lanceren door de komende dagen te integreren met Google Assistant.
Dit is een van de grootste prestaties van het Google-kamp dit jaar om een meer menselijke interface te creëren waarmee gebruikers verschillende taken gemakkelijk kunnen uitvoeren. Laten we dus wachten en kijken naar de uitrol van Google duplex in de komende dagen.
Bron
Swayam is een professionele techblogger met een masterdiploma in computertoepassingen en heeft ook ervaring met Android-ontwikkeling. Hij is een fervent bewonderaar van Stock Android OS. Naast tech bloggen houdt hij van gamen, reizen en gitaar spelen / lesgeven.