Google Duplex: Noul sistem AI care poate executa sarcini din lumea reală
știri / / August 05, 2021
În acest an, Google scoate la dispoziția publicului unele dintre cele mai bune inovații ale sale. Majoritatea actualizărilor, instrumentelor și programelor sale actuale sunt în principal centrate pe AI. Unul dintre ele este un sistem extrem de inteligent și automatizat, care poate efectua apeluri telefonice și îndeplinește anumite sarcini. Necesitatea capacității computerelor de a înțelege și de a realiza vorbirea naturală a dus la formarea Google Duplex.
Astăzi, sistemele telefonice automate obișnuite nu sunt suficient de prompte pentru a recunoaște comenzile de bază. Nu se angajează într-un flux de conversație și forțează apelantul să se adapteze la sistem în loc să se adapteze sistemul la apelant. Aici intră în scenă Duplex.
Google Duplex, țintește să îndeplinească sarcini de „lume reală” prin telefon. Include finalizarea unor sarcini specifice, cum ar fi programarea întâlnirilor sau rezervarea meselor în restaurant. Pentru aceasta, sistemul automat face o conversație naturală cu reprezentantul restaurantului prin telefon. Un alt avantaj este că Duplex permite comunicarea asincronă cu furnizorii de servicii. Google Duplex poate solicita întâlniri în afara orelor de program și chiar și cu conectivitate limitată.
De asemenea, promovează accesibilitatea și ajută la depășirea barierelor lingvistice. Aceasta înseamnă că ajută utilizatorii cu deficiențe audio să-și rezerve o întâlnire. Chiar și utilizatorii care nu vorbesc limba locală pot executa sarcini prin telefon.
Puteți, de exemplu, să vedeți cum Google Duplex apelează la restaurant pentru a rezerva un loc. Iată un eșantion audio pentru același lucru. Vedeți cum este clar, până la vârf și natural în general.
De obicei, într-o conversație firească, oamenii vorbesc cu mai puțină claritate. Există pauze, omisiuni însoțite de zgomote de fond ocazionale. Acum, dacă este o convoadă de la om la om, aceasta va fi oarecum adaptabilă în mod natural și conversația se îmbunătățește. Dar imaginați-vă dacă conversația umană la mașină atunci erorile în conversație și recunoașterea vorbirii pot fi dificile, în funcție de diferiți factori.
Acesta este modul în care funcționează Google Duplex.
Google Duplex poate efectua conversații complexe și execută sarcini pe deplin autonom. Nu există absolut nici o implicare umană. Sistemul are o capacitate de auto-monitorizare, care îi permite să recunoască sarcinile pe care nu le poate îndeplini în mod autonom. În aceste cazuri, semnalează către un utilizator uman, pentru a finaliza sarcina.
Duplexul are un nucleu de rețea neuronală care utilizează ieșirea recunoașterii automate a vorbirii (ASR) a Google. De asemenea, se referă la caracteristicile audio, istoric și constrângeri ale conversației. Folosește o combinație a unui motor text to speech (TTS) și un motor de sinteză pentru a controla intonația în funcție de situație. Acțiunea duplex este mai naturală datorită utilizării disfluențelor de vorbire, cum ar fi „hmm” sau „uhh”.
Iată un exemplu despre modul în care duplexul poate răspunde la întreruperi.
Din nou, aruncați o privire asupra modului în care poate oferi un răspuns inteligent.
Inginerii se așteaptă în curând să lanseze Duplex prin integrarea cu Asistentul Google în zilele următoare.
Aceasta este una dintre cele mai mari realizări din tabăra Google din acest an pentru a oferi o interfață mai umană, care poate ajuta utilizatorii să îndeplinească cu ușurință diferite sarcini. Așadar, să așteptăm și să urmărim lansarea Google duplex în zilele următoare.
Sursă
Swayam este un blogger de tehnologie profesionist, cu o diplomă de master în aplicații informatice și are, de asemenea, experiență în dezvoltarea Android. Este un admirator fervent al sistemului de operare Stock Android. În afară de blogging-ul tehnologic, iubește jocurile, călătoriile și cântatul / predarea chitarei.