Google Duplex: Das neue KI-System, das Aufgaben der realen Welt ausführen kann
News / / August 05, 2021
In diesem Jahr stellt Google einige der besten seiner Innovationen der Öffentlichkeit zur Verfügung. Die meisten aktuellen Updates, Tools und Programme sind hauptsächlich AI-zentriert. Eines davon ist ein hochintelligentes und automatisiertes System, das Anrufe tätigen und bestimmte Aufgaben ausführen kann. Die Notwendigkeit, dass Computer natürliche Sprache verstehen und ausführen können, hat zur Bildung von Google Duplex geführt.
Heutzutage sind normale automatisierte Telefonsysteme nicht schnell genug, um grundlegende Befehle zu erkennen. Sie führen keinen Gesprächsfluss und zwingen den Anrufer, sich an das System anzupassen, anstatt dass sich das System an den Anrufer anpasst. Hier kommt Duplex ins Spiel.
Google Duplex zielt darauf ab, "reale" Aufgaben über das Telefon auszuführen. Dazu gehört das Erledigen bestimmter Aufgaben, z. B. das Planen von Terminen oder das Buchen von Tischen im Restaurant. Zu diesem Zweck führt das automatische System ein natürliches Gespräch mit dem Restaurantvertreter über das Telefon. Ein weiterer Vorteil ist, dass Duplex die asynchrone Kommunikation mit Dienstanbietern ermöglicht. Google Duplex kann Termine außerhalb der Geschäftszeiten und auch bei eingeschränkter Konnektivität anfordern.
Es fördert auch die Zugänglichkeit und hilft, Sprachbarrieren zu überwinden. Dies bedeutet, dass Benutzer mit eingeschränkter Audioqualität einen Termin buchen können. Selbst Benutzer, die möglicherweise nicht die Landessprache sprechen, können Aufgaben über das Telefon ausführen.
Sie können beispielsweise sehen, wie Google Duplex das Restaurant anruft, um einen Sitzplatz zu reservieren. Hier ist ein Hörbeispiel dafür. Sehen Sie, wie klar es ist, auf das Pint und insgesamt natürlich.
Normalerweise sprechen die Leute in einem natürlichen Gespräch weniger klar. Es gibt Pausen, Auslassungen und gelegentliche Hintergrundgeräusche. Wenn es sich nun um eine Convo von Mensch zu Mensch handelt, ist dies auf natürliche Weise anpassungsfähig und die Konversation wird verbessert. Stellen Sie sich jedoch vor, dass Fehler in der Konversation und Spracherkennung in Abhängigkeit von verschiedenen Faktoren schwierig sein können, wenn die Convo von Mensch zu Maschine erfolgt.
So funktioniert Google Duplex.
Google Duplex kann komplexe Gespräche führen und Aufgaben völlig autonom ausführen. Es gibt absolut keine menschliche Beteiligung. Das System verfügt über eine Selbstüberwachungsfunktion, mit der es die Aufgaben erkennen kann, die es nicht autonom ausführen kann. In diesen Fällen signalisiert es einem menschlichen Benutzer, die Aufgabe abzuschließen.
Der Duplex verfügt über einen neuronalen Netzwerkkern, der die Ausgabe der automatischen Spracherkennung (ASR) von Google verwendet. Es bezieht sich auch auf Funktionen aus dem Audio, den Verlauf und die Einschränkungen der Konversation. Es verwendet eine Kombination aus einer Text-zu-Sprache-Engine (TTS) und einer Synthese-Engine, um die Intonation je nach Situation zu steuern. Die Aktion von Duplex ist natürlicher, da Sprachstörungen wie "hmm" oder "uhh" verwendet werden.
Hier ist ein Beispiel, wie Duplex auf Unterbrechungen reagieren kann.
Schauen Sie sich noch einmal an, wie es eine intelligente Antwort liefern kann.
Ingenieure erwarten bald, Duplex durch die Integration in Google Assistant in den kommenden Tagen zu starten.
Dies ist eine der größten Errungenschaften im Google-Camp in diesem Jahr, um eine benutzerfreundlichere Benutzeroberfläche bereitzustellen, mit der Benutzer verschiedene Aufgaben problemlos ausführen können. Warten wir also ab, bis Google Duplex in den kommenden Tagen eingeführt wird.
Quelle
Swayam ist ein professioneller Tech-Blogger mit einem Master-Abschluss in Computeranwendungen und hat auch Erfahrung mit der Android-Entwicklung. Er ist ein überzeugter Bewunderer von Stock Android OS. Neben dem technischen Bloggen liebt er das Spielen, Reisen und das Spielen / Unterrichten von Gitarre.