Google Duplex: Новата AI система, която може да изпълнява задачи от реалния свят
новини / / August 05, 2021
Тази година Google пуска някои от най-добрите иновации на обществеността. Повечето от текущите актуализации, инструменти и програми са предимно за ИИ. Един от тях е високо интелигентна и автоматизирана система, която може да осъществява телефонни разговори и да изпълнява определени задачи. Необходимостта от способността на компютрите да разбират и изпълняват естествена реч доведе до формирането на Google Duplex.
Днес обикновените автоматизирани телефонни системи не са достатъчно бързи, за да разпознават основните команди. Те не участват в разговор и принуждават повикващия да се приспособи към системата, вместо системата да се приспособи към повикващия. Тук Дуплекс излиза на сцената.
Google Duplex има за цел да изпълнява задачи от „реалния свят“ по телефона. Включва изпълнение на специфични задачи, като планиране на срещи или резервационни маси в ресторанта. За това автоматичната система прави естествен разговор с представителя на ресторанта по телефона. Друго предимство е, че Duplex позволява асинхронна комуникация с доставчиците на услуги. Google Duplex може да иска срещи в извънработно време и дори с ограничена свързаност.
Той също така насърчава достъпността и помага за преодоляване на езиковите бариери. Това означава, че помага на потребителите с увреден звук да резервират среща. Дори потребителите, които може да не говорят местния език, могат да изпълняват задачи по телефона.
Можете например да видите как Google Duplex се обажда до ресторанта, за да резервира място. Ето и аудио проба за същото. Вижте как е ясно, до пинта и като цяло естествено.
Обикновено при естествен разговор хората говорят с по-малка яснота. Има паузи, пропуски, придружени от случайни фонови шумове. Сега, ако става дума за човешки конвой, това ще бъде донякъде естествено адаптивно и разговорът ще се подобри. Но представете си, че ако човек се съобразява с машината, грешките в разговора и разпознаването на реч може да са трудни в зависимост от различни фактори.
Ето как работи Google Duplex.
Google Duplex може да извършва сложни разговори и да изпълнява задачи напълно автономно. Няма абсолютно никакво човешко участие. Системата има възможност за самоконтрол, което й позволява да разпознава задачите, които не може да изпълнява автономно. В тези случаи той сигнализира на човешки потребител да изпълни задачата.
Duplex има ядро на невронна мрежа, което използва изхода на автоматичното разпознаване на реч от Google (ASR). Той също така се отнася както до функции от аудиото, историята и ограниченията на разговора. Той използва комбинация от механизъм за преобразуване на текст в реч (TTS) и механизъм за синтез, за да контролира интонацията в зависимост от ситуацията. Действието на дуплекса е по-естествено поради използването на речеви дисфлуенции като казване „хмм“ или „ъъъ“.
Ето пример за това как дуплексът може да реагира на прекъсвания.
Отново погледнете как може да осигури интелигентен отговор.
Скоро инженерите очакват да пуснат Duplex чрез интеграция с Google Assistant през следващите дни.
Това е едно от най-големите постижения в лагера на Google тази година, за да донесе по-човешки интерфейс, който може да помогне на потребителите да изпълняват лесно различни задачи. Така че, нека да изчакаме и да наблюдаваме пускането на Google дуплекс през следващите дни.
Източник
Swayam е професионален технически блогър с магистърска степен по компютърни приложения и също има опит с разработването на Android. Той е убеден почитател на Android Android OS, Освен технологичните блогове, той обича да играе, да пътува и да свири / преподава китара.