¡Hola, fanáticos de la tecnología! Hoy os traigo una historia que hará que los amantes del DIY (Hazlo Tú Mismo) y la informática se pongan de pie y aplaudan. Vito Plantamura, aquel genio que nos dejó boquiabiertos este verano, vuelve a la carga ejecutando las mejores aplicaciones de Deep Learning en esa pequeña gran maravilla que es la Raspberry Pi Zero 2 W y que no para de sorprendernos.
De Stable Diffusion 1.5 a XL 1.0
Recordaréis que Plantamura logró ejecutar Stable Diffusion 1.5 en una Raspberry Pi Zero 2 W. Pues bien, esta vez el desafío fue aún mayor. Ha conseguido hacer funcionar el Stable Diffusion XL 1.0, ¡y con solo 298MB de RAM!
Para los que no lo sepan, Stable Diffusion es esa aplicación que permite crear imágenes a partir de palabras clave usando inteligencia artificial. En su versión anterior, Vito ya había logrado ejecutarla utilizando menos de 260MB de RAM. Pero lo realmente sorprendente es la aplicación que hace posible esta magia: OnnxStream.
¿Por qué es un logro tan impresionante?
Si entendéis un poco de estos temas, sabréis que el Stable Diffusion XL 1.0 es una bestia con cerca de mil millones de parámetros. Imagina tratar de meter un elefante en un Seat 600. ¡Eso es lo que hizo Plantamura!
La Raspberry Pi Zero 2 W solo tiene 512MB de RAM, y se recomienda que para ejecutar Stable Diffusion se disponga de al menos 8GB. No hace falta ser matemático para darse cuenta de que este era un desafío mayúsculo.
La magia detrás: decodificación por baldosas
Lo que diferencia esta versión de su predecesora es la técnica del «tile decoding» o decodificación por baldosas. Este proceso permite reducir el consumo total de RAM de 4.4GB a esos sorprendentes 298MB.
Las imágenes se procesan en fragmentos que, en conjunto, generan un efecto de mosaico con visibles fronteras entre cada sección. Pero, ¡no os preocupéis! Con un pequeño efecto de desenfoque, estas fronteras se disimulan, como podéis ver en las imágenes proporcionadas por Vito.
Más que un proyecto, una obra de arte
A pesar de que este proyecto puede no ser práctico para el uso diario (ya que lleva mucho más tiempo utilizar la aplicación), es sin duda una demostración impresionante de lo que es posible con un poco de ingenio y mucha determinación.
Para quienes quieran indagar más, todo el material está disponible en GitHub. Y os recomiendo seguir de cerca a Plantamura. ¿Quién sabe con qué nos sorprenderá la próxima vez?
392