Esta página ha sido traducida usando inteligencia artificial y aprendizaje automático.

(Pocket-lint) - Desde que Google demostró su capacidad de Google Duplex en Google IO el año pasado, la reacción ha sido abrumadoramente positiva en términos de tecnología y posibilidades dentro del Asistente de Google.

  • El Asistente Pixel 4 de Google estará en el dispositivo, será más rápido y mucho más potente.

Google Duplex explicado

Google Duplex es esencialmente un nombre para tecnologías que se ubicarán dentro del Asistente de Google y, esencialmente, harán cosas en su nombre. La idea es ahorrarle tiempo. Puede llamar a las empresas para que haga reservas, reserve citas, obtenga horas de operación y más. Realizará estas llamadas con una voz que suena humana que puede escuchar en los videos a continuación.

No hay curva de aprendizaje ni pasos adicionales para configurar Duplex. Si está habilitado, puede preguntarle al Asistente de Google en su teléfono algo como "Hola Google, llame al [nombre del restaurante] y haga una reserva para cuatro personas el 22 de octubre a las 7 p.m.". A partir de ese momento, el Asistente de Google realizará la llamada y Google Duplex hablará con quien conteste el teléfono en el restaurante. Y lo que es más, todo sucede en un segundo plano.

Duplex también agregará sus reservas y citas a su calendario.

"Permitir que las personas interactúen con la tecnología tan naturalmente como interactúan entre sí ha sido una promesa a largo plazo", dijo el jefe de ingeniería de Google, Yossi Matias, en el momento del anuncio original de Duplex.

“La tecnología Google Duplex está diseñada para sonar natural, para hacer que la conversación sea cómoda.

"Esperamos que estos avances tecnológicos contribuyan en última instancia a una mejora significativa en la experiencia de las personas en las interacciones cotidianas con las computadoras".

Donde Duplex se ha extendido hasta ahora

El despliegue de la tecnología Duplex de Google todavía está limitado a los EE. UU. Y aunque Google prometió adoptar un "enfoque lento y medido" con la función, ahora está disponible en dispositivos aparte de los teléfonos Google Pixel .

En marzo, Google anunció que también estaría disponible en 44 estados después de un período beta inicial que había incluido solo cuatro ciudades de EE. UU. No se sabe a dónde se desplegará a continuación, pero presumiblemente, depende de mucha localización para llevarlo al Reino Unido, por ejemplo.

Duplex para la web

Recientemente anunciado en Google I / O 2019 es Duplex para la Web. Con esto, Duplex va más allá del discurso y ahora puede completar información y formularios para usted en varias páginas. A menudo, cuando reserva cosas en línea, tiene que navegar por varias páginas, pellizcando y haciendo zoom para completar todos los formularios.

Con Duplex para la web, el Asistente esencialmente actuará en su nombre para completar cosas de acuerdo con sus preferencias habituales: Google demostró cómo Duplex puede reservar un automóvil; vea el video a continuación. Sundar Pichai de Google: [Completar formularios es] "lleva mucho tiempo y si pierdes usuarios en el flujo de trabajo, las empresas también pierden. Nuestro sistema puede hacerlo mejor".

Esta es solo una vista previa en este momento, pero esperamos escuchar más sobre esto más adelante en 2019.

¿Debería la IA realmente pretender ser humana?

Más allá del deseo de crear una mejor experiencia con Inteligencia Artificial (IA), Duplex plantea algunas preocupaciones de que, en primer lugar, dicha capacidad dentro del Asistente de Google nos haría bastante vagos y, en segundo lugar, había una preocupación significativa por el potencial de Duplex para engañar a esos a quienes se llama en su nombre.

Es perfectamente posible que Duplex admita a la persona que se llama que en realidad es una computadora que los llama. ¿Importa si la interacción es tan natural como con un humano?

Está abierto a debate, aunque la demostración demostró claramente que Google ha tratado de hacer que la experiencia sea lo más natural posible, exagerando un poco con el lenguaje de relleno como "er" o "um" en las llamadas de muestra.

Tales disfluencias del habla son utilizadas por los humanos para construir en el tiempo de pensamiento y ese también es el caso aquí; ocultando que el sistema todavía está pensando también. Google agrega que, aunque esperamos que algunas cosas sean respondidas al instante, como cuando saludamos por primera vez en una llamada telefónica, en realidad es más natural tener pausas en otros lugares.

"Es importante para nosotros que los usuarios y las empresas tengan una buena experiencia con este servicio", continúa Matias. “La transparencia es una parte clave de eso. Queremos ser claros acerca de la intención de la llamada para que las empresas entiendan el contexto.

Aquí está la demostración de Google Duplex en acción durante la conferencia magistral de E / S de Google del año pasado:

¿Podemos confiar en la IA todavía?

Otro problema con Duplex es que nuestras experiencias con asistentes virtuales y otros sistemas de control de voz nos han llevado a desconfiar de ellos. O, al menos, no confiar en ellos por completo.

Existe la preocupación obvia de que es posible que no obtenga el resultado que desea de un asistente virtual que le encargó reservar una mesa para usted. ¿Sería en el momento adecuado e incluso en el restaurante adecuado? Cuando el sistema detecta que no ha podido obtener el resultado deseado, la idea de Google es que será honesto y le indicará esto.

Si bien no hay una razón racional para que estos detalles estén equivocados, la tentación como humano es desconfiar de que un asistente virtual pueda hacer todo bien, ¿realmente podría interpretar los matices del lenguaje con precisión?

Google argumentó en el escenario y nuevamente en la publicación del blog de soporte de Google Duplex que la idea detrás del sistema es llevar a cabo tareas muy específicas, como programar una cita de peluquería o reservar una mesa. A menos que esté entrenado para hacerlo, no puede llamar de repente a su médico y comenzar a conversar.

Esto es realmente bastante complicado

El lenguaje natural es difícil de entender, mientras que la velocidad de la conversación requiere un poder de computación en la nube bastante rápido. Las personas están acostumbradas a tener interacciones complejas con otros humanos que, dice Matias, pueden ser "más detalladas de lo necesario, u omitir palabras y confiar en el contexto. [Las conversaciones humanas naturales] también expresan una amplia gama de intenciones, a veces en la misma oración ".

Google dice que otros desafíos a la tecnología son el ruido de fondo y la mala calidad de las llamadas, lo cual es un sello distintivo de muchas llamadas telefónicas, además de que las personas tienden a hablar más rápido si están hablando con otro humano de lo que lo harían si pensaran que están dando comandos de voz a un ordenador.

El contexto también es muy importante, por supuesto, y tendemos a hacer conexiones contextuales que las computadoras tradicionalmente no hacen. Entonces, durante una reserva de restaurante, el humano podría decir un número que podría significar el tiempo o podría significar el número de personas.

Google dice que está combatiendo estos desafíos con el uso de una red neuronal recurrente que es idea para una serie de entradas como las que obtendría durante una conversación telefónica. El sistema todavía utiliza la tecnología de reconocimiento automático de voz (ASR) de Google y las capas en los matices de esa conversación en particular; ¿Cuál es el objetivo de la conversación? ¿Qué se ha dicho anteriormente?

¿Cuáles son los beneficios de Duplex?

Hay varios beneficios para la tecnología Duplex, argumenta Google (más allá de ayudar a las personas ocupadas). En primer lugar, podría beneficiar a las empresas que no tienen sistemas de reserva en línea, ya que los usuarios aún pueden reservar citas en línea y también recibirán recordatorios sobre esa cita del Asistente, lo que generará menos citas perdidas.

En segundo lugar, podría hacer que los datos locales específicos en línea sean más precisos. Google citó el ejemplo del horario de apertura de la tienda en la búsqueda de Google en momentos especiales del año. ¿Podría llamar a una tienda local y pedir su horario de Navidad, por ejemplo?

Google dice que las actuales interacciones de voz humano-computadora no participan en un flujo de conversación y obligan a la persona que llama a adaptarse al sistema en lugar de que el sistema se ajuste a la persona que llama.

Y, por supuesto, podría ayudar a aquellos que tienen dificultades para usar el teléfono debido a una discapacidad.

¿Me gusto esto? Echa un vistazo a los huevos de Pascua del Asistente de Google: tu guía completa de divertidos comandos del Asistente

Escrito por Dan Grabham y Maggie Tillman.