¿Qué es DALL·E? La primera generación de IA para crear imágenes a partir de texto
En enero de 2021, OpenAI, una empresa dedicada a la investigación y comercialización de Inteligencia Artificial General lanza DALL·E. Esta red neuronal fue entrenada para crear imágenes a partir de texto para diversos conceptos que se pueden expresar en lenguaje natural.
Sus creadores la bautizaron con una combinación de dos nombres bien conocidos: Por una parte el artista Salvador Dalí y por otra WALL·E, el protagonista de la película homónima de Pixar estrenada en 2008.
Usando 12.000 millones de parámetros entrenados para generar imágenes a partir de textos descriptivos, esta red neuronal podía conseguir resultados como el que ves a continuación si se introducía, por ejemplo el texto «un sillón con forma de aguacate».
¿Qué es DALL·E 2? La evolución de DALL·E
DALL·E 2 es un nuevo sistema de Inteligencia Artificial que puede crear imágenes fotorealistas a partir de una descripción en lenguaje natural. DALL·E 2 puede crear imágenes originales, realistas y arte a partir de una simple descripción textual. Además consigue combinar conceptos, atributos y estilos.
DALL·E 2 es mejor que DALL·E 1, ya que entiende mejor los textos (71.7%) y el resultado es más realista (88.8%). Al menos es lo que opinaron los evaluadores a los que se les enseñó 1.000 imágenes de cada modelo para comparar.
Para ver de manera más clara la diferencia, observa cuál es la imagen resultante en ambos casos para el texto «un dibujo de un zorro sentado en un campo durante el amanecer al estilo de Claude Monet». A continuación, el resultado.
¿Qué puede hacer DALL·E 2 con las imágenes?
DALL·E 2 puede editar imágenes ya existentes usando el lenguaje natural. También podrá añadir o eliminar elementos mientras tiene en cuenta las sombras, los reflejos y las texturas.
DALL·E 2 también puede tomar una imagen como referencia y realizar diversas variaciones en función del original. Aquí puedes ver más ejemplos de lo que esta red neuronal puede hacer.
¿Cómo funciona DALL·E 2?
DALL·E 2 ha aprendido la relación que hay entre imágenes y el texto usado para describirlas. Utiliza un procedimiento llamado «difusión», que empieza con un patrón aleatorio de dos puntos y gradualmente lo altera encaminándose a una imagen cuando reconoce aspectos específicos de ésta. Este método es por ejemplo el que se usa para mejorar imágenes en baja resolución y con el que ya está trabajando Google.
Si quieres conocer de manera MUY detallada cómo funciona DALL·E 2 y todo el trabajo de investigación que hay detrás, puedes hacer clic aquí. Si prefieres algo más visual y ligero, OpenAI te lo cuenta en este vídeo.
¿Es segura DALL·E 2?¿Qué están implementando como medidas de precaución?
DALL·E 2 es un proyecto de investigación que no se incluye en la API que comercializa OpenAI. Parte del esfuerzo, dicen, es desarrollar una Inteligencia Artificial responsablemente. Se encuentran estudiando sus limitaciones con un selecto grupo de usuarios.
Prevenir resultados dañinos
OpenAI ha limitado la habilidad de DALL·E 2 para generar imágenes violentas, que inciten al odio o para adultos. Eliminando el contenido más explícito del proceso de entrenamiento, han minimizado la exposición de DALL·E 2 a este tipo de conceptos. También han usado técnicas para prevenir resultados realistas de rostros de individuos reales, incluidos personajes públicos.
Mitigar el uso inadecuado
Además de que su política no permita el uso de DALL·E 2 para generar imágenes violentas o con contenido adulto y de que sus filtros lo eviten, cuentan con sistemas automáticos y humanos de cribado.
¿Cómo probar DALL·E 2? ¿Existe una demo de DALL·E 2?
DALL·E 2 no está disponible para cualquier persona que quiera probarla. Para probar debes seguir estos pasos:
- Dirígete a la página de lista de espera de DALL·E 2 en la web de OpenAI
- Rellena tus datos personales e indica si perteneces a alguno de estos grupos: Artistas profesionales, desarrolladores, investigadores académicos, periodistas o creadores de contenido online.
- Desde OpenAI priorizarán y valorarán tu petición y te darán acceso a la herramienta si lo consideran oportuno.
Si no puedes esperar, dale un vistazo a Dalle Mini y ponte a crear imágenes a partir de texto desde ahora mismo.
¿Sustituirá DALL·E 2 a los diseñadores gráficos?
En el canal de Youtube The Studio han querido llevar a cabo un experimento. Le han dado a su diseñador gráfico, Tim, tres encargos para competir con las que ya había creado esta inteligencia artificial.
Se le pidió que hiciera uso de sus habilidades profesionales para editar imágenes a partir de otras. A continuación, el equipo de The Studio las comparó y trató de averiguar quién había sido la persona (o máquina) responsable de ejecutarla.
¿Quieres saber quién se llevó más votos? Mira el siguiente vídeo: