Google Duplex: Nový systém AI, který může plnit úkoly v reálném světě
Zprávy / / August 05, 2021
V letošním roce Google zveřejňuje některé z nejlepších svých inovací pro veřejnost. Většina jeho aktuálních aktualizací, nástrojů a programů je primárně zaměřena na AI. Jedním z nich je vysoce inteligentní a automatizovaný systém, který umožňuje telefonovat a vykonávat určité úkoly. Potřeba schopnosti počítačů porozumět a provádět přirozenou řeč vedla k vytvoření Google Duplex.
Dnes běžné automatizované telefonní systémy nejsou dostatečně rychlé, aby rozpoznaly základní příkazy. Nezapojují se do konverzace a přinutí volajícího, aby se přizpůsobil systému, místo aby se systém přizpůsobil volajícímu. Zde vstupuje na scénu duplex.
Google Duplex se zaměřuje na provádění úkolů „skutečného světa“ po telefonu. Zahrnuje dokončení konkrétních úkolů, jako je plánování schůzek nebo rezervace stolů v restauraci. Automatický systém proto telefonicky komunikuje se zástupcem restaurace. Další výhodou je, že Duplex umožňuje asynchronní komunikaci s poskytovateli služeb. Google Duplex může požádat o schůzky mimo pracovní dobu, a to i při omezeném připojení.
Rovněž podporuje přístupnost a pomáhá překonávat jazykové bariéry. To znamená, že pomáhá sluchově postiženým uživatelům rezervovat si schůzku. Dokonce i uživatelé, kteří nemluví místním jazykem, mohou provádět úkoly po telefonu.
Můžete například vidět, jak Google Duplex volá do restaurace a rezervuje si místo. Zde je ukázka zvuku pro stejné. Podívejte se, jak je to jasné, na půllitr a celkově přirozené.
Při přirozené konverzaci lidé obvykle mluví méně jasně. Existují pauzy, opomenutí doprovázené občasnými zvuky pozadí. Nyní, pokud se jedná o konvoj mezi lidmi, bude to přirozeně adaptivní a konverzace se zlepší. Ale představte si, že pokud je jeho konvoj mezi člověkem a strojem, pak chyby v konverzaci a rozpoznávání řeči mohou být obtížné v závislosti na různých faktorech.
Takto funguje Google Duplex.
Google Duplex může provádět složité konverzace a provádět úkoly zcela autonomně. Neexistuje absolutně žádná lidská účast. Systém má schopnost samostatného monitorování, která mu umožňuje rozpoznat úkoly, které nemůže provést samostatně. V těchto případech to signalizuje lidskému uživateli k dokončení úkolu.
Duplex má jádro neuronové sítě, které využívá výstup automatického rozpoznávání řeči (ASR) společnosti Google. Odkazuje také na funkce zvuku, historie a omezení konverzace. Využívá kombinaci modulu převodu textu na řeč (TTS) a syntézního modulu pro řízení intonace v závislosti na situaci. Duplexova akce je přirozenější díky použití řečových poruch, jako je „hmm“ nebo „uhh“.
Zde je příklad toho, jak duplex může reagovat na přerušení.
Znovu se podívejte na to, jak může poskytnout chytrou odpověď.
Inženýři brzy očekávají spuštění Duplexu integrací s Google Assistant v nadcházejících dnech.
Jedná se o jeden z největších úspěchů letošního tábora Google, který přináší lidštější rozhraní, které uživatelům pomůže snadno provádět různé úkoly. Počkejme si tedy na zavedení duplexu Google v příštích dnech.
Zdroj
Swayam je profesionální tech blogger s magisterským studiem počítačových aplikací a má také zkušenosti s vývojem systému Android. Je oddaným obdivovatelem Stock Android OS. Kromě technologických blogů miluje hraní, cestování a hraní / výuku kytary.