Google Duplex: новая система искусственного интеллекта, которая может выполнять реальные задачи
новости / / August 05, 2021
В этом году Google представляет публике некоторые из лучших своих инноваций. Большинство текущих обновлений, инструментов и программ ориентированы в первую очередь на ИИ. Одна из них - высокоинтеллектуальная и автоматизированная система, которая может совершать телефонные звонки и выполнять определенные задачи. Потребность в способности компьютеров понимать и говорить естественную речь привела к созданию Google Duplex.
Сегодня обычные автоматизированные телефонные системы не обладают достаточной скоростью для распознавания основных команд. Они не участвуют в разговоре и не заставляют звонящего приспособиться к системе вместо того, чтобы система приспосабливалась к звонящему. Здесь на сцену выходит Duplex.
Google Duplex предназначен для выполнения «реальных» задач по телефону. Он включает в себя выполнение определенных задач, таких как планирование встреч или бронирование столиков в ресторане. Для этого автоматическая система организует естественный разговор с представителем ресторана по телефону. Еще одно преимущество состоит в том, что Duplex обеспечивает асинхронную связь с поставщиками услуг. Google Duplex может запрашивать встречи в нерабочее время и даже при ограниченном подключении.
Это также способствует доступности и помогает преодолеть языковые барьеры. Это означает, что это помогает пользователям с ослабленным звуком записаться на прием. Даже пользователи, которые могут не говорить на местном языке, могут выполнять задачи по телефону.
Вы можете, например, увидеть, как Google Duplex звонит в ресторан, чтобы забронировать место. Вот аудио образец того же. Посмотрите, насколько он чистый, до пинты и в целом натуральный.
Обычно в естественном разговоре люди говорят менее ясно. Бывают паузы, пропуски, сопровождающиеся эпизодическими фоновыми шумами. Теперь, если это общение между людьми, это будет несколько естественным образом адаптироваться, и разговор улучшится. Но представьте, что если это человек-машина, то ошибки в разговоре и распознавании речи могут быть затруднены в зависимости от различных факторов.
Так работает Google Duplex.
Google Duplex может вести сложные разговоры и выполнять задачи полностью автономно. Здесь нет абсолютно никакого человеческого участия. Система имеет возможность самоконтроля, что позволяет ей распознавать задачи, которые она не может выполнить автономно. В этих случаях он сигнализирует пользователю-человеку о необходимости выполнить задачу.
Дуплекс имеет ядро нейронной сети, которое использует результаты автоматического распознавания речи (ASR) Google. Это также относится к функциям аудио, истории и ограничениям разговора. Он использует комбинацию механизма преобразования текста в речь (TTS) и механизма синтеза для управления интонацией в зависимости от ситуации. Действие Duplex более естественное из-за использования дефектов речи, таких как «хммм» или «эээ».
Вот пример того, как дуплекс может реагировать на прерывания.
Опять же, посмотрите, как это может дать разумный ответ.
Вскоре инженеры планируют запустить Duplex с интеграцией с Google Assistant в ближайшие дни.
Это одно из самых больших достижений в лагере Google в этом году - сделать интерфейс более понятным, помогая пользователям легко выполнять различные задачи. Итак, давайте подождем и посмотрим, как в ближайшие дни выйдет двусторонняя печать Google.
Источник
Сваям - профессиональный технический блоггер со степенью магистра компьютерных приложений, а также имеет опыт разработки под Android. Он убежденный поклонник Stock Android OS. Помимо технических блогов, он любит игры, путешествовать и играть на гитаре.