Si DALL-E 2 de OpenAI te pareció increíble por su capacidad de generar imágenes «bonitas» a partir de tan solo una descripción sencilla alucinarás al conocer lo que se puede hacer con,,,  TRANSFRAMER de Google.

TRANSFRAMER es un modelo de inteligencia artificial, basado en la red neuronal DeepMind de Google, que “sobresale en la predicción de video y la síntesis de vista” y es capaz de generar videos de 30 [segundos] a partir de una sola imagen”.

El algoritmo  hace sus videos en perspectiva al predecir el entorno de las imágenes de destino con “imágenes de contexto“; en resumen, al adivinar correctamente cómo se vería un objeto desde diferentes perspectivas en función de una amplia información de entrenamiento que permite “imaginar” un objeto real desde otro ángulo.

Este modelo es capaz de aplicar la percepción de profundidad artificial y la perspectiva para generar cómo se vería la imagen si alguien se “moviera” a su alrededor.

556
Suscribirse
Notificación
0 Comments
Inline Feedbacks
Ver todos los comentarios
0
¡Aquí puedes dejar tus comentarios!x