Compartir

Por: Carlos del Porto Blanco

Un término muy popular en la actualidad es el de Inteligencia Artificial Generativa, sus caras más visibles son los chatbots inteligentes Copilot, ChatGTP y Gemini entre otros). La IA generativa se está desplegando de forma nativa en diferentes entornos, siendo el más relevante el de las computadoras y los smartphones. ¿Pero quién permite su funcionamiento? A ella dedicaremos esta columna.

Olvídense de la Inteligencia Artificial: en el nuevo y valiente mundo de los macrodatos, es la idiotez artificial lo que debemos tener en cuenta. Tom Chatfield.

Las Unidades de Procesamiento Neuronal (NPU) son un nuevo paso en el diseño de procesadores. En este caso sirven para apoyar a las aplicaciones de Inteligencia Artificial. Las NPU son unidades especializadas en el trabajo con redes neuronales y Aprendizaje Automático (Machine Learning), lo que las hace un componente de primer orden en la creación de aplicaciones avanzadas de IA.

Haré un pequeño paréntesis para comentar sobre un concepto que está en la base de los hablamos, las redes neuronales. Una red neuronal es conjunto de algoritmos que “imitan” la estructura del cerebro humano. Gracias a esa estructura, las personas somos capaces de aprender, identificar patrones y predecir el futuro basándonos en nuestra experiencia. En los algoritmos, esta estructura permite a las máquinas emular esas capacidades de la mente humana.

¿Qué son las NPU?

Una NPU, o Neural Processing Unit, (Unidad de Procesamiento Neuronal) es una pieza especializada de hardware diseñada para acelerar los cálculos de una red neuronal. Debido a su diseño, las NPU mejoran drásticamente la velocidad y la eficiencia de los sistemas de Inteligencia Artificial.

Las NPU son un gran paso adelante para el procesamiento de la Inteligencia Artificial y el Aprendizaje Automático. Las NPU son especialmente eficientes en tareas como el reconocimiento de imágenes y el procesamiento del lenguaje natural, áreas que requieren un procesamiento rápido de grandes cantidades de datos multimediales. Las NPU no compiten necesariamente con sus homólogos más reconocibles, las CPU (Unidad Central de Procesamiento) y las GPU (Unidad de Procesamiento Gráfico). En lugar de ello, las NPU son complementarias para estas últimas y las funciones que realizan.

Las CPU, incluso las mejores, son solo motores informáticos de uso general. Son capaces de manejar una amplia gama de tareas, pero carecen de una optimización especializada para algunas tareas. Por ejemplo, el procesamiento paralelo. Las GPU, por su parte, se especializan en el procesamiento paralelo y son especialmente buenas en cálculos complejos como los gráficos.

¿Cómo funciona una NPU?

Las NPU están especialmente diseñadas para procesar algoritmos de Aprendizaje Automático. Si bien las GPU son muy buenas para procesar datos paralelos, las NPU se han creado específicamente para los cálculos necesarios para ejecutar redes neuronales responsables de los procesos de Inteligencia Artificial y Aprendizaje Automático.

Las NPU y su capacidad incorporada para la computación de alto rendimiento tienen un gran impacto en el rendimiento de la IA. Las multiplicaciones y las convoluciones matriciales son tareas especializadas de las que dependen los procesos de IA y en las que destacan las NPU. El reconocimiento de imágenes y el Procesamiento de Lenguaje Natural son las áreas en las que las NPU transforman el sector, ya que ofrecen unos tiempos de inferencia más rápidos y un menor consumo energético.

Unidades de Procesamiento Neuronal frente a Unidades de Procesamiento Gráfico

Como se mencionó anteriormente, las NPU y las GPU difieren significativamente en cuanto a arquitectura, rendimiento y su aplicación. Las NPU y las GPU son diferentes piezas de hardware, cada una optimizada para lo que mejor hace: NPU para tareas de Inteligencia Artificial y Aprendizaje Automático y GPU para representación gráfica.

Las NPU son hardware especializado diseñado específicamente para acelerar los cálculos de la red neuronal, por lo que su arquitectura se creó a la medida para las tareas de Aprendizaje Automático o Aprendizaje Profundo. Las GPU, por el contrario, son mucho más fuertes en la representación gráfica. Las GPU tienen una arquitectura generalizada con miles de núcleos. Las NPU tienen un diseño más optimizado con hardware dedicado para tareas como multiplicaciones de matrices y convoluciones.

Las NPU tienden a superar a las GPU en tareas de inferencia en tiempo real en los dispositivos perimetrales, donde la baja latencia y la eficiencia energética son fundamentales. Las NPU también son preferibles en las aplicaciones que exigen el procesamiento de la Inteligencia Artificial en el dispositivo. Por ejemplo, en los vehículos autónomos y los dispositivos de Internet de las Cosas IoT. Las NPU superan a las GPU por las velocidades de carga de trabajo de la Inteligencia Artificial en entornos con recursos limitados.

Importancia de las NPU

La importancia de estos dispositivos está dada en tres aspectos fundamentalmente:

  1. Eficiencia Energética: Las NPU se diseñan para consumir menos energía mientras realizan tareas intensivas en datos. Eso es especialmente importante en dispositivos móviles y en la Internet de las Cosas (IoT), donde la duración de la batería es fundamental.
  2. Velocidad de Procesamiento: Debido a su arquitectura especializada, las NPU pueden procesar grandes volúmenes de datos de manera paralela, lo que permite que puedan realizar tareas de IA en tiempo real, algo esencial para aplicaciones como el reconocimiento facial y la conducción autónoma.
  3. Escalabilidad: A medida que la demanda de procesamiento de datos aumenta, los NPU ofrecen una solución escalable que puede adaptarse a diferentes necesidades, desde dispositivos pequeños hasta centros de datos masivos.

Aplicaciones de las NPU

Las NPU se utilizan en varios campos, entre los que se encuentran:

  • Automóviles Autónomos: Procesan datos de sensores en tiempo real para tomar decisiones rápidas y seguras.
  • Dispositivos Móviles: Mejoran la experiencia del usuario al permitir funciones avanzadas como la fotografía computacional y asistentes virtuales.
  • Salud: Ayudan en el análisis de imágenes médicas y en la predicción y tratamiento de enfermedades a partir de grandes conjuntos de datos.

Uno de los impulsores de las NPU es Microsoft, con las llamadas PC Copilot+. Se trata de equipos que ya vienen con el asistente inteligente de Windows, el que se despliega en el sistema operativo y sus aplicaciones. Ese nuevo tipo de computadora exige la existencia de las NPU pero no cualquiera de estas, sino aquella con más de 40 TO[i]P.

Cerrando el juego

En cualquier tarea que se acometa, debe existir un equilibrio entre tener la herramienta adecuada para cada parte del trabajo y la sencillez de tener una herramienta generalizada. Esa desventaja es la razón por la que, por ejemplo, los carpinteros aficionados no invierten en una sierra circular, una sierra de inglete, una sierra de mesa, una sierra de banda, una sierra giratoria y una motosierra hasta que necesitan una para el trabajo que están acometiendo. Este es el caso de las CPU, GPU y NPU, o como diría Napoleón, Zapatero a su zapato.

Las unidades de procesamiento neuronal pueden revolucionar, y lo están haciendo, la forma de encarar las cargas de trabajo de la Inteligencia Artificial y el Aprendizaje Automático.

Referencias

 

 

[i] TOP equivale a una tera operación por segundo que es un millón de millones de operaciones por segundo (1012).