Si DALL-E 2 de OpenAI te pareció increíble por su capacidad de generar imágenes «bonitas» a partir de tan solo una descripción sencilla alucinarás al conocer lo que se puede hacer con,,, TRANSFRAMER de Google.
TRANSFRAMER es un modelo de inteligencia artificial, basado en la red neuronal DeepMind de Google, que “sobresale en la predicción de video y la síntesis de vista” y es capaz de “generar videos de 30 [segundos] a partir de una sola imagen”.
El algoritmo hace sus videos en perspectiva al predecir el entorno de las imágenes de destino con “imágenes de contexto“; en resumen, al adivinar correctamente cómo se vería un objeto desde diferentes perspectivas en función de una amplia información de entrenamiento que permite “imaginar” un objeto real desde otro ángulo.
Transframer is a general-purpose generative framework that can handle many image and video tasks in a probabilistic setting. New work shows it excels in video prediction and view synthesis, and can generate 30s videos from a single image: https://t.co/wX3nrrYEEa 1/ pic.twitter.com/gQk6f9nZyg
— Google DeepMind (@GoogleDeepMind) August 15, 2022
Este modelo es capaz de aplicar la percepción de profundidad artificial y la perspectiva para generar cómo se vería la imagen si alguien se “moviera” a su alrededor.
570