Google Duplex: Det nye AI-system, der kan udføre opgaver i den virkelige verden
Nyheder / / August 05, 2021
I år sender Google nogle af de bedste af sine innovationer ud til offentligheden. De fleste af dets aktuelle opdateringer, værktøjer og programmer er primært AI-centreret. En af det er meget intelligent og automatiseret system, der kan foretage telefonopkald og udføre bestemte opgaver. Behovet for computerers evne til at forstå og udføre naturlig tale har ført til dannelsen af Google Duplex.
I dag er almindelige automatiserede telefonsystemer ikke hurtige nok til at genkende grundlæggende kommandoer. De deltager ikke i en samtalestrøm og tvinger den, der ringer op, til at tilpasse sig systemet i stedet for at systemet tilpasser sig den, der ringer op. Det er her Duplex kommer ind på scenen.
Google Duplex, mål for at udføre "virkelige verden" opgaver over telefonen. Det inkluderer udfyldelse af specifikke opgaver, såsom planlægning af aftaler eller bookingtabeller i restauranten. Til dette gør det automatiske system en naturlig samtale med restaurantens repræsentant over telefonen. En anden fordel er, at Duplex muliggør asynkron kommunikation med tjenesteudbydere. Google Duplex kan anmode om aftaler i åbentider og endda med begrænset tilslutningsmuligheder.
Det fremmer også tilgængelighed og hjælper med at overvinde sprogbarrierer. Dette betyder, at det hjælper lydhæmmede brugere med at bestille en aftale. Selv de brugere, der muligvis ikke taler det lokale sprog, kan udføre opgaver over telefonen.
Du kan for eksempel se, hvordan Google Duplex ringer til restauranten for at reservere et sæde. Her er en lydeksempel på det samme. Se hvordan det klart, til halvliter og generelt naturlige.
Normalt taler folk i en naturlig samtale med mindre klarhed. Der er pauser, undladelser ledsaget af lejlighedsvis baggrundsstøj. Hvis det nu er en menneskelig-til-menneske-konvo, vil dette være noget naturligt tilpasningsdygtigt, og samtalen bliver forbedret. Men forestil dig, at hvis det er menneskeligt til maskinkonvo, kan fejl i samtalen og talegenkendelse være vanskelige afhængigt af forskellige faktorer.
Sådan fungerer Google Duplex.
Google Duplex kan udføre komplekse samtaler og udfører opgaver fuldt autonomt. Der er absolut ingen menneskelig involvering. Systemet har en selvovervågningsfunktion, der gør det muligt at genkende de opgaver, det ikke kan udføre autonomt. I disse tilfælde signaliserer det til en menneskelig bruger at fuldføre opgaven.
Duplexen har en neuralt netværkskerne, der bruger output fra Googles automatiske talegenkendelse (ASR). Det refererer også til samt funktioner fra lyden, historien og begrænsningerne i samtalen. Det bruger en kombination af en tekst til tale-motor (TTS) -motor og en syntesemotor til at kontrollere intonation afhængigt af situationen. Duplex's handling er mere naturlig på grund af brugen af taleforstyrrelser som at sige "hmm" eller "uhh".
Her er et eksempel på, hvordan duplex kan reagere på afbrydelser.
Se igen, hvordan det kan give et smart svar.
Ingeniører forventer snart at starte Duplex ved at integrere med Google Assistant i de kommende dage.
Dette er en af de største bedrifter under Googles lejr i år for at bringe en mere menneskelig grænseflade, der kan hjælpe brugerne med at udføre forskellige opgaver let. Så lad os vente og se på udrulningen af Google duplex i de kommende dage.
Kilde
Swayam er en professionel teknisk blogger med en kandidatgrad i computerapplikationer og har også erfaring med Android-udvikling. Han er en dybt beundrer af Stock Android OS, bortset fra teknisk blogging, han elsker at spille, rejse og spille / undervise i guitar.