Google Duplex: nowy system sztucznej inteligencji, który może wykonywać zadania w świecie rzeczywistym
Aktualności / / August 05, 2021
W tym roku Google upublicznia niektóre ze swoich najlepszych innowacji. Większość aktualnych aktualizacji, narzędzi i programów koncentruje się głównie na sztucznej inteligencji. Jednym z nich jest wysoce inteligentny i zautomatyzowany system, który może wykonywać połączenia telefoniczne i wykonywać określone zadania. Potrzeba zdolności komputerów do rozumienia i wykonywania mowy naturalnej doprowadziła do powstania Google Duplex.
Obecnie zwykłe automatyczne systemy telefoniczne nie są wystarczająco szybkie, aby rozpoznawać podstawowe polecenia. Nie angażują się w przebieg rozmowy i zmuszają rozmówcę do dostosowania się do systemu, zamiast do tego, aby system dostosował się do rozmówcy. W tym miejscu na scenę wkracza Duplex.
Google Duplex służy do wykonywania zadań w „prawdziwym świecie” przez telefon. Obejmuje wykonywanie określonych zadań, takich jak planowanie spotkań lub rezerwowanie stolików w restauracji. W tym celu automatyczny system dokonuje naturalnej rozmowy telefonicznej z przedstawicielem restauracji. Kolejną zaletą jest to, że Duplex umożliwia asynchroniczną komunikację z dostawcami usług. Google Duplex może prosić o spotkania poza godzinami pracy, a nawet przy ograniczonej łączności.
Promuje również dostępność i pomaga pokonać bariery językowe. Oznacza to, że pomaga użytkownikom z upośledzeniem słuchu zarezerwować spotkanie. Nawet użytkownicy, którzy nie mówią w lokalnym języku, mogą wykonywać zadania przez telefon.
Możesz na przykład zobaczyć, jak Google Duplex dzwoni do restauracji, aby zarezerwować miejsce. Oto próbka audio dla tego samego. Zobacz, jak to jasne, do kufla i ogólnie naturalne.
Zwykle podczas naturalnej rozmowy ludzie mówią mniej wyraźnie. Są przerwy, przeoczenia, którym towarzyszą sporadyczne odgłosy w tle. Jeśli jest to konwój między ludźmi, będzie to w pewnym stopniu naturalnie adaptacyjne, a rozmowa ulegnie poprawie. Ale wyobraź sobie, że jeśli to konwój między człowiekiem a maszyną, to błędy w rozmowie i rozpoznawaniu mowy mogą być trudne w zależności od różnych czynników.
Tak działa Google Duplex.
Google Duplex może prowadzić złożone rozmowy i wykonywać zadania w pełni autonomicznie. Nie ma absolutnie żadnego zaangażowania człowieka. System posiada funkcję samokontroli, która pozwala mu rozpoznawać zadania, których nie może wykonać samodzielnie. W takich przypadkach sygnalizuje użytkownikowi, że ma wykonać zadanie.
Duplex ma rdzeń sieci neuronowej, który wykorzystuje dane wyjściowe automatycznego rozpoznawania mowy (ASR) Google. Odnosi się również do funkcji audio, historii i ograniczeń rozmowy. Wykorzystuje połączenie silnika zamiany tekstu na mowę (TTS) i silnika syntezy do kontrolowania intonacji w zależności od sytuacji. Działanie Duplexa jest bardziej naturalne ze względu na użycie niepłynności mowy, takich jak „hmm” lub „uhh”.
Oto przykład tego, jak dupleks może reagować na zakłócenia.
Ponownie spójrz, jak może zapewnić inteligentną odpowiedź.
Inżynierowie wkrótce spodziewają się uruchomienia Duplex poprzez integrację z Asystentem Google w najbliższych dniach.
To jedno z największych osiągnięć tegorocznych obozów Google, polegające na wprowadzeniu bardziej ludzkiego interfejsu, który może pomóc użytkownikom w łatwym wykonywaniu różnych zadań. Więc poczekajmy i obserwujmy wprowadzenie dupleksu Google w najbliższych dniach.
Źródło
Swayam jest profesjonalnym blogerem technicznym z tytułem magistra w zakresie aplikacji komputerowych, a także ma doświadczenie w programowaniu na Androida. Jest zagorzałym wielbicielem systemu operacyjnego Stock Android Poza blogowaniem technicznym uwielbia gry, podróże i grę na gitarze.