Primero OpenAI y ahora Google, han dado a conocer sus proyectos Dalle-2 e Imagen, respectivamente, dos proyectos que utilizan la IA para reproducir imágenes hiperrealistas a partir de texto.
Inteligencia Artificial para crear imágenes en 3D desde el lenguaje natural
Fecha de publicación: 31/05/2022
En los últimos años, hemos sido testigos del gran avance que ha experimentado los software con inteligencia artificial, que ya se está utilizando para optimizar funciones de automatización, interpretación o recuperación de datos, entre otras muchas.
Recientemente, el desarrollo de la IA ha alcanzado un enfoque más visual con la presentación de Dalle-2 por parte de OpenAI. Se trata de una IA para generar imágenes a partir de descripciones escritas por los usuarios, con resultados de un gran realismo.
Cualquier imagen que seas capaz de imaginar se materializa empleando esta tecnología, dando lugar a representaciones nítidas y de gran detalle, gracias a las herramientas de procesamiento de lenguaje natural que integra.
A partir de texto descriptivo, cualquier imagen que puedas imaginar se hace realidad con la Inteligencia Artificial.
Esta innovadora propuesta de OpenAI ya ha tenido una respuesta. Ahora es Google quien presenta Imagen, su propio proyecto de IA en torno a esta línea de desarrollo. Igual que Dalle-2, Imagen crea imágenes fotorrealistas a partir de textos. Está construido a partir de grandes modelos lingüísticos para lograr el gran entendimiento del lenguaje del que es capaz, y sigue trabajando con nuevos modelos para poder generar imágenes con mayor nivel de fidelidad a las descripciones.
Tanto Google como OpenAI son conscientes de las amplias posibilidades de uso y mal uso que estos nuevos modelos de difusión pueden ofrecer, y trabajan de forma cerrada en sus respectivas tecnologías. En el caso de Dalle-2 es posible solicitar probar la IA desde un formulario, mientras que con Imagen han decidido mantenerla completamente aislada.
Los modelos de lenguaje genéricos de gran tamaño son ideales para las funciones de estos proyectos de IA y permiten conseguir imágenes de alta calidad y relación con el texto.