Los equipos para tratamiento de la información evolucionan rápidamente en negocios, empresas y de hecho en todos los ámbitos del día a día.
Una tendencia creciente está moviendo la potencia de computación hacia el Edge. Gartner predice que para 2025, el Edge procesará el 75 % de los datos generados por cualquier uso o aplicación, incluidos los de las fábricas, la atención médica y el transporte. De hecho, se puede correlacionar la adopción de Edge computing con el aumento de la inteligencia artificial (IA), que está haciendo que las fábricas sean más inteligentes, está mejorando los resultados de los pacientes cuando la aplicación es de ámbito de salud, aumentando la seguridad de los vehículos autónomos, así como aumentando los volúmenes de datos, que son más grandes que nunca y aun crecen de manera exponencial.
Sin ir más lejos, los datos de equipos de fabricación, sensores, sistemas de visión artificial y sistemas de gestión de almacenes en una sola fábrica inteligente podrían sumar fácilmente 1 petabyte por día.
Cuando las empresas implementaron por primera vez los sistemas integrados, los arquitectos de esos sistemas no podían imaginar los volúmenes de datos que generarían la IA, el Internet de las cosas (IoT) y otras tecnologías avanzadas. Ahora que el panorama ha cambiado, los sistemas integrados de hace diez años tienen que adaptarse para admitir la informática de vanguardia de hoy, y la que está por llegar.
Muchas cargas de trabajo de IA hoy en día se procesan en la nube. Sin embargo, a medida que más datos de gran ancho de banda imponen demandas crecientes a estos sistemas, el procesamiento de datos en el borde (EDGE Computing) tiene sentido en términos de latencia, confiabilidad, movilidad, seguridad, eficiencia energética y costos de transmisión de datos.
Para cumplir con las nuevas demandas de hoy, el hardware debe evolucionar desde sistemas basados en reglas y control hacia entornos centrados en datos para adaptarse a la IA de borde.
Una guía de tipos de procesadores para cargas de trabajo de IA en el EDGE
Los requisitos de hardware para procesar cargas de trabajo de IA varían según el caso de uso. La IA puede basarse en una amplia gama de inputs, tales como videos, imágenes, audio, datos de sensores y datos de PLC. El desafío al que se enfrentan los arquitectos de sistemas es elegir los mejores núcleos informáticos para sus aplicaciones de IA.
Esta guía le puede ayudar a tener en cuenta los diferentes tipos de núcleos de procesamiento que se pueden usar en los sistemas perimetrales, destacando los puntos fuertes de cada uno.
- CPU
La unidad central de procesamiento (CPU) es una unidad de procesamiento de uso general y suele tener entre 4 y 16 núcleos. Las CPU ejecutan tareas complejas y facilitan la gestión del sistema.
Funcionan bien con entradas de datos mixtos, por ejemplo con sistemas que usan audio y texto, o procesos de extracción, transformación y carga (ETL).
- GPU
Las unidades de procesamiento de gráficos (GPU) son núcleos altamente paralelos (100 o 1000) para la representación de gráficos de alta velocidad. Ofrecen un procesamiento de alto rendimiento y debido a la gran cantidad de núcleos pequeños, las GPU se adaptan bien a las cargas de trabajo de IA. Ello facilita tanto el entrenamiento de redes neuronales como la inferencia de IA.
Pero por lo general, ocupan más espacio y consumen más energía que las CPU.
- FPGA
La FPGA, (matriz de puertas programables en campo), es un dispositivo basado en bloques lógicos programables en funcionalidad y conectividad. Por lo general, en comparación con las CPU y las GPU consumen menos energía, pero su punto fuerte principal es que permiten la reprogramación por parte de ingenieros con experiencia en programación. Pueden ser la mejor opción cuando se requiere un alto grado de flexibilidad.
- ASIC
Los circuitos integrados específicos de la aplicación (ASIC) son una lógica personalizada diseñada utilizando las bibliotecas de circuitos de un fabricante y ofrecen las ventajas de un bajo consumo de energía, velocidad y un tamaño reducido. Sin embargo, al ser diseñados a medida de una aplicación, requieren de mucho tiempo de desarrollo (desventajas en time-to-market) y es más costoso que otras opciones. Por todo ello, los ASIC se recomiendan especialmente para aplicaciones que se ejecutarán en volúmenes muy altos.
Los tipos de ASIC incluyen:
- Unidades de procesamiento de visión (VPU), procesadores de imagen y visión y coprocesadores
- Unidades de procesamiento de tensor (TPU), como la primera TPU desarrollada por Google para su frame de aprendizaje automático, TensorFlow
- Unidades de cómputo neuronal (NCU), incluidas las de ARM
Cada tipo de núcleo es adecuado para diferentes tipos de cálculos, y usarlos juntos en aplicaciones informáticas heterogéneas proporciona toda la funcionalidad que requieren las aplicaciones complejas. Usados juntos, también pueden equilibrar las cargas de trabajo, impulsar diferentes rendimientos de inferencia de IA y crear la configuración más rentable y eficiente.
Pasos para seleccionar hardware integrado para Edge AI
La selección de un sistema de hardware integrado para procesar IA en el EDGE generalmente requiere evaluar tres factores principales:
Rendimiento
El sistema de hardware central debe ser capaz de ofrecer la velocidad que exigen las aplicaciones de IA perimetrales complejas, y con un uso intensivo de datos mientras funciona de manera consistente y fiable. Incluso en entornos hostiles.
Intercambio
SWaP es un acrónimo de tamaño, peso y potencia (Size, Weight And Power, SWaP). Además de brindar la funcionalidad que requiere la aplicación, el hardware perimetral también debe cumplir con las especificaciones de tamaño y peso para cumplir con las restricciones físicas de la aplicación, y como requisito paralelo a su funcionalidad principal, deben ser equipos ya concebidos pensando en requisitos de mínimo consumo energético.
Coste
El coste del hardware perimetral puede variar según los tipos de núcleos y los fabricantes. Es necesario determinar cuál ofrece la funcionalidad y las especificaciones suficientes para poner en marcha el proyecto en base a cuadros comparativos que relacionen ventajas / capacidad de procesamiento / consumo energético / precio
Hardware de borde en el trabajo
Los siguientes ejemplos son solo algunos de los muchos use cases en los que la innovación de hardware de vanguardia permite que la IA aporte valor hoy.
Plataformas de aceleración de aprendizaje profundo
Las plataformas de aceleración de aprendizaje profundo (DLAP) permiten diversas funcionalidades, incluida la adquisición de datos, el preprocesamiento de imágenes, el análisis de imágenes y la aceleración de IA. También dan a las máquinas la capacidad de mejorar su propio rendimiento y tomar decisiones. Al reemplazar los dispositivos de borde heredados que envían datos a la nube para su procesamiento con DLAP, las operaciones pueden ver respuestas más rápidas, así como una mayor seguridad y control.
Los DLAP pueden aprovechar el diseño heterogéneo, por ejemplo, utilizando CPU para administrar la adquisición de datos y el preprocesamiento de imágenes y GPU para acelerar el procesamiento de tareas paralelas mientras mantienen el sistema perimetral pequeño y eficiente en el consumo de energía.
La serie DLAP de ADLINK, por ejemplo, está diseñada para funcionar en entornos industriales e incluso hostiles. Pueden operar en temperaturas extremas, alta humedad y en casos de uso donde los golpes y las vibraciones son habituales. La característica de los equipos relativa a estar preparados para estas condiciones se conoce como optimizado por SWaP para IA perimetral. Las unidades compactas de ADLINK contienen una GPU integrada NVIDIA® Quadro® o una supercomputadora NVIDIA® Jetson™ en un módulo y se pueden usar para aplicaciones de inferencia basadas en IA, visión artificial y control autónomo de máquinas.
Ejemplos
Autopago con IA: ahora que lo de comer con tranquilidad es algo del pasado, las personas buscan formas rápidas de comprar comidas . La adopción del autoservicio está creciendo entre los consumidores y la IA puede modernizar las experiencias de los clientes. En la caja de un restaurante o tienda, la visión artificial puede identificar los artículos en un solo escaneo y mostrar el total a pagar, en menos de 1,5 segundos con ADLINK DLAP-211-JT2. Los clientes pueden completar sus compras de forma rápida y cómoda.
Brazo en C de rayos X móvil: un equipo médico debe ser fiable, duradero y diseñado para un alto rendimiento. Los equipos móviles también deben empaquetar toda la potencia informática necesaria en un diseño compacto con bajo consumo de energía. La combinación de CPU y módulo de GPU MXM integrado, el sistema habilitado para GPU industrial más pequeño del mundo, cumple con esas especificaciones.
IA en módulos
Las GPU Mobile PCI Express Module (MXM) permiten ejecutar IA en tarjetas gráficas del tamaño de la palma de la mano. Ofrecen importantes ventajas SWaP, incluidos tamaños que son solo una fracción de las tarjetas PEG de longitud completa. Proporcionan un alto rendimiento por vatio y están diseñados para condiciones extremas, como ventilación limitada o nula, espacios pequeños, temperaturas altas o bajas y entornos polvorientos o incluso corrosivos.
Ejemplos
Reconocimiento facial AI: el control de acceso es vital para evitar la entrada no autorizada a plantas de fabricación, instalaciones de investigación, centros de datos y otras áreas altamente controladas. Una puerta de reconocimiento facial de IA elimina la necesidad de tarjetas de identificación (que pueden falsificarse) y reemplaza esos sistemas heredados con tecnología que identifica a los usuarios autorizados, incluso si usan gafas o gorra, en una fracción de segundo. Incluso puede distinguir entre un rostro humano real y una foto.
Seguridad aeroportuaria: los sistemas de vigilancia panorámica del aeropuerto brindan una vista de 360 grados de las pistas, el tráfico aéreo y terrestre, y un mayor grado de conocimiento de la situación que los sistemas de monitoreo heredados. Estas tecnologías de IA están respaldadas por un dispositivo Edge resistente y sin ventilador, diseñado para uso en exteriores, integrado con una GPU de alto rendimiento que admite una vigilancia mejorada tanto de día como de noche.
Robótica de borde
La innovación de hardware también está haciendo posible la robótica en el perímetro . Recientemente Eclipse Cyclone DDS ha sido seleccionado como el middleware predeterminado de ROS 2 con un próximo lanzamiento de mayo de 2021? Esto es emocionante porque es la misma tecnología de servicio de distribución de datos (DDS) dentro de nuestros controladores de robótica integrados ROScube , que ayudan a los robots a comunicarse consigo mismos y con el mundo que los rodea.
Ejemplo:
Robots móviles autónomos en la fabricación: los AMR con tecnología de IA de borde pueden negociar sus entornos y comprender el contexto utilizando tecnologías de visión artificial, 5G y DDS. Fair Friend Group , uno de los mayores fabricantes de Taiwán, utiliza actualmente 5G sobre infraestructura DDS para permitir el mantenimiento remoto con realidad aumentada, visión artificial para la inspección automatizada y enjambres AMR para el manejo de materiales en su fábrica.
Visión artificial con IA
Los sistemas de visión artificial basados en IA aprovechan las cámaras industriales integradas y los sistemas informáticos de última generación con GPU, VPU y CPU integradas de alto rendimiento para realizar tareas. Debido a que toda la potencia informática está en el perímetro, se eliminan los problemas de latencia y ancho de banda. Además, con el hardware de vanguardia adecuado, las cámaras inteligentes pueden mantener un espacio reducido, peso, potencia, rendimiento y requisitos de costo para la visión artificial con IA.
Ejemplo: