Intel y Amazon dan voz a los hogares inteligentes del futuro

El nuevo Intel Voice Enablement Developer Kit facilita la creación de productos equipados con Amazon Alexa Voice Service

 

Por Miles Kingston

Los avances recientes en inteligencia artificial, aprendizaje automático y procesamiento del lenguaje natural están comenzando a destacar el enorme potencial que tienen los hogares inteligentes. A medida que estas tecnologías continúen aprendiendo y mejorando, muchas de las tareas que se realizan en el hogar acabarán automatizándose para ofrecer tranquilidad y para mejorar la vida diaria de las personas.  De hecho, una encuesta reciente de Intel indicó que el 68% de los norteamericanos afirmó que un hogar con dispositivos inteligentes les facilitaría sus vidas1

Los consumidores están comenzando a mostrar una disposición cada vez mayor para introducir los comandos por voz en sus hogares inteligentes.  Sólo debemos observar lo que está ocurriendo con los altavoces inteligentes y los asistentes personales: este año, 35,6 millones de norteamericanos van a usar un electrodoméstico activado por voz al menos una vez al mes, según unas estimaciones de eMarketer, lo que representa un incremento del 128,9% respeto al año 2016.

Intel, en colaboración con Amazon Alexa Voice Service* (AVS), está simplificando la aceleración del diseño de productos de consumo equipados con AVS para los desarrolladores de terceras partes. Hoy, Intel ha anunciado el Intel® Speech Enabling Developer Kit, que proporciona una solución de interfaz de audio completo para el control de voz lejana.

El reconocimiento de voz se ha convertido en una clara ventaja competitiva para los desarrolladores de productos.  Así y todo, la capacidad para proporcionar a las máquinas la posibilidad de escuchar, hablar y conversar mediante lenguaje natural no resulta fácil.

El lenguaje natural necesita ser reconocido con claridad para responder a los comandos del usuario desde una distancia razonable.  Las personas hablan y escuchan en 360º, no solamente en línea directa. Los dispositivos necesitan contar con una serie de micrófonos y una tecnología compleja para la reducción de ruido. Una interacción de voz de calidad permite a los dispositivos identificar el emplazamiento de la señal acústica, reducir y eliminar el ruido ambiente y entender los comandos por voz en los micrófonos, incluso cuando se reproduzca música (es decir, cando se habla y se escucha al mismo tiempo), además de activarse cuando escuche la voz para ello (por ejemplo, cuando se diga “Alexa”).

Se precisa una gran cantidad de trabajo de ingeniería para lograr el reconocimiento de voz a un alto nivel de velocidad y precisión para proporcionar la mejor experiencia al consumidor.  El Intel Speech Enabling Developer Kit se basa en una nueva arquitectura que proporciona prestaciones mediante voz lejana de alta calidad incluso en los entornos acústicos más complicados.  Este avance se encuentra entre las últimas soluciones creadas para el hogar inteligente, entre las que se incluye el Amazon Echo Show* equipado con tecnología de Intel.

El Intel® Speech Enabling Developer Kit ya se puede reservar. Entre los componentes tecnológicos del kit para el desarrollador podemos destacar:

  • Los algoritmos de alto rendimiento para la cancelación de eco, la reducción de ruido, la formación de haces y las palabras personalizadas de activación (como, por ejemplo “Alexa”)
  • Doble DSP de Intel con motor de inferencias
  • Sistema circular de 8 micrófonos de Intel

Miles Kingston es director general del Smart Home Group en Intel Corporation.

 

 

1La encuesta de Intel se realizó a través de Internet a 2.552 norteamericanos mayores de edad, en marzo de 2017 para conocer los puntos de vista de los estadounidenses sobre el uso de los ordenadores, la tecnología personal, la tecnología en los hogares inteligentes, la realidad virtual y los juegos. La encuesta fue realizada por Ipsos.


Glosario

Enseñando hablar a los dispositivos: Algoritmos para voz lejana

La formación de haces identifica el emplazamiento de la señal de voz y dirige la entrada del micrófono hacia ese lugar. La formación de haces también ayuda a reducir el ruido e incluso a eliminar el ruido ambiente.

La cancelación del eco acústico (AEC) elimina la salida de audio proveniente de la señal de voz para evitar interferencias con el micrófono.  De esta manera, se permite una clara identificación de los comandos cuando se reproduce música.  El algoritmo para AEC precisa la voz de la persona que habla como referencia en el DSP para la supresión de audio.

La detección de la palabra clave (KWS) detecta las palabras de activación (por ejemplo, “Alexa”) y avisa al sistema correspondiente.  La implementación de firmware en el DSP permite el funcionamiento en modo de bajo consumo en dispositivos con asistentes personales activados mediante palabras clave.

About Intel

Intel (NASDAQ: INTC), líder en el sector de los semiconductores, da forma al futuro centrado en los datos con tecnologías de la informática y las comunicaciones que son la base de las innovaciones mundiales. La amplia experiencia de la compañía nos ayuda a la hora de afrontar los mayores desafíos mundiales, además de asegurar, potenciar y conectar miles de millones de dispositivos y la infraestructura del mundo inteligente y conectado – desde la nube a las redes, el Edge Computing y todo lo que se encuentra entre estos extremos. Para más información sobre Intel, visita newsroom.intel.com e intel.com.

Intel y el logotipo de Intel son marcas comerciales de Intel Corporation en EE.UU. y en otros países
*Otros nombres y marcas pueden ser propiedad de otras compañías.