Qué esperar al crear imágenes de IA con DALL-E: los pros y los contras

DALL-E es una creación de OpenAI, diseñada para generar imágenes de manera más eficiente que otros modelos de arte de IA. Teniendo en cuenta la exageración que lo rodea y que el público ahora tiene acceso a él, es una buena idea conocer sus ventajas y desventajas antes de invertir su tiempo y dinero potencial.


Esto es lo que puede esperar de DALL-E al crear imágenes de IA para sus proyectos. Hay muchos aspectos positivos y negativos a tener en cuenta.


También te puede interesar[NLP Note]incrustación

Los beneficios de usar Dall-E para imágenes de IA

DALL-E es verdaderamente una herramienta rápida y poderosa para generar arte sin tener que contratar a un experto. Analicemos las principales ventajas de usar DALL-E para crear imágenes de IA a partir de descripciones de texto.

1. DALL-E crea imágenes con difusión

Las redes antagónicas generativas (GAN) solían ser la mejor manera para que los programas de IA aprendan y recreen imágenes, pero los modelos de difusión han demostrado ser más efectivos e impresionantes en sus resultados.

También te puede interesarImplementar BLIP2 en HuggingFace

Este método básicamente crea un patrón de puntos o ruido que se construye gradualmente en la imagen deseada y puede proporcionar imágenes de IA de mayor calidad. Sin embargo, eso no significa que siempre obtenga los resultados que desea, un problema que se analiza a continuación.

Cuando se trata de la tecnología de DALL-E, el mensaje y el tema correctos pueden generar hermosas obras de arte, ya sea que necesite que se vean como pinturas o fotografías.

También te puede interesar¡10 algoritmos de aprendizaje automático que dominarán el 2023!

2. DALL-E es generosa con sus créditos

Una de las principales ventajas de unirse a la familia DALL-E es que obtiene muchos más créditos para usar que otras plataformas.

Tu primer mes viene con 50 créditos gratis para gastar en cualquiera de las herramientas de generación de imágenes de DALL-E, mientras que cada mes subsiguiente te da 15 créditos.

También te puede interesar6 formas en que el arte generado por IA está cambiando el futuro del arte

Tenga en cuenta que los créditos gratuitos no se transfieren al mes siguiente. Las sobras caducan, por lo que es mejor usarlas todas mientras puedas. Pero los créditos comprados son acumulativos y son una verdadera ganga. Por ejemplo, $15 te da 115 créditos, más que suficiente para seguir adelante si te quedas sin tu suministro gratuito.

3. DALL-E responde bien a las indicaciones

Gracias a los algoritmos avanzados que funcionan en segundo plano, es menos probable que obtenga resultados irrelevantes para el aviso.

También te puede interesar5 cosas que puedes crear con generadores de arte AI

Es posible que las imágenes que obtenga no siempre sean perfectas, pero reflejarán bastante bien su descripción. Y cuantos más detalles agregue al mensaje, mejor entenderá DALL-E lo que quiere.

También te puede interesarOlvídese de DALL-E: este es el mejor generador de texto a imagen de IA …

Si especifica que su imagen debe ser abstracta, realista o de fantasía, la IA le dará lo mejor de sus capacidades.

4. La creación de imágenes con IA es rápida

A pesar de la complejidad de su sistema, DALL-E trabaja rápidamente. No lleva más de unos minutos obtener las imágenes que solicitó, sin importar cuán detallado sea su mensaje.

También te puede interesarCómo usar DALL-E 2 para crear imágenes de IA a partir de descripciones de texto

Si los resultados son precisos es un asunto diferente, pero al menos podrá confiar en el gran poder de procesamiento de la plataforma.

5. DALL-E ofrece muchas variaciones de imagen

Cada solicitud de imagen genera cuatro variantes. A continuación, puede seleccionar una única creación y solicitar alternativas. DALL-E también te permite subir imágenes y obtener sus variaciones. Antes de que te des cuenta, tendrás un muro de imágenes creadas por IA, pero hay herramientas adicionales que permiten una mayor edición.

Una forma de editar una imagen generada o cargada es eliminar las partes que no le gustan y solicitar cambios, lo que solo cambiará las secciones que haya eliminado. No solo eso, sino que puede cargar una imagen y agregar un marco de construcción de 1024 x 1024 a su alrededor, el único tamaño disponible en el momento de escribir este artículo.

Su solicitud de variación luego llenará el espacio vacío dentro del marco, lo que le permitirá crear imágenes compuestas y diferentes versiones de ellas.

Una desventaja es que no puede eliminar imágenes individuales en su colección. Su única opción es eliminar todas sus imágenes existentes y comenzar una nueva colección.

6. Puedes editar imágenes en DALL-E

El editor de DALL-E está en versión beta y sus funciones son limitadas, pero se mejora y amplía constantemente para permitirle trabajar correctamente en sus imágenes de IA en lugar de tener que crear otras nuevas hasta que encuentre la mejor solución.

Como ya se mencionó, el editor ofrece un borrador, un cargador de imágenes y un marco de generación, así como herramientas para seleccionar y desplazarse por la imagen.

También puede descargar su creación, lo cual es muy recomendable ya que DALL-E aún no guarda sus proyectos de edición. Para continuar trabajando en la imagen, simplemente súbala.

Las desventajas de usar Dall-E para imágenes de IA

DALL-E es excelente para generar impresionantes imágenes de IA, pero aún está en pañales y tiene inconvenientes que pueden desanimarlo por ahora.

1. El registro puede llevar algún tiempo

Obtener acceso a DALL-E implica completar un formulario con sus datos y esperar a que OpenAI lo revise y le envíe una invitación.

Puede tomar varias semanas recibir una respuesta, por lo que si no tiene tiempo que perder, no es la mejor plataforma para usted. Siempre puedes olvidarte de DALL-E y probar el generador de imágenes AI de Midjourney.

2. La calidad de los gráficos es baja para algunos consejos

Ya sea que necesite imágenes que contengan paisajes, rostros humanos o estilos artísticos populares, DALL-E es inigualable en calidad y potencial para desarrollar una obra maestra, ya sea que deba o no considerar las imágenes generadas por IA como arte real.

Pero cuando se trata de solicitudes no convencionales que requieren descripciones complejas, como extrañas criaturas inventadas, DALL-E parece tener problemas y las imágenes producidas no son tan buenas.

Debido a que los generadores de arte de IA aprenden de las imágenes, el texto y otros materiales en línea existentes, si su descripción aún no coincide con los datos suficientemente relevantes para que el algoritmo se base en ellos, el resultado se ve afectado.

En el caso de DALL-E, parece funcionar mejor con indicaciones tradicionales. Si las imágenes que necesita son muy inusuales, es posible que deba refinar sus descripciones y dedicar más tiempo a editarlas.

Alternativamente, pruebe con una plataforma diferente. Afortunadamente, hay muchos otros generadores de arte de imágenes de texto de IA gratuitos para explorar que actualizan constantemente sus servicios para competir con DALL-E.

3. Debe especificar qué estilo desea

Otros servicios de generación de imágenes de IA como StarryAI y NightCafe muestran una selección de estilos para elegir, pero DALL-E no tiene ninguno.

Si desea que sus imágenes reflejen un tipo particular de arte, como el surrealismo, el ciberpunk o el estilo de Da Vinci, debe incluirlo en su sugerencia.

En otras palabras, es posible que deba investigar un poco sobre artistas y movimientos si desea una imagen con un efecto visual específico. De lo contrario, puede cargar imágenes existentes con el estilo que desee y orientar DALL-E en la dirección correcta.

4. DALL-E puede crear imágenes dañinas

En su vista previa de GitHub de DALL-E, el propio OpenAI menciona problemas con la generación de imágenes maliciosas causadas por la gran cantidad de datos estereotipados o explícitos que el algoritmo recopila de Internet.

Ese no es siempre el caso ahora que OpenAI trabaja para frustrar los problemas, pero cuando solicita imágenes de, por ejemplo, un padre, una enfermera o un director ejecutivo, aún notará patrones de género o sesgo étnico.

Además de los estereotipos, la creación de imágenes de DALL-E a veces utiliza imágenes explícitas que coinciden con su solicitud, lo que da como resultado imágenes que pueden ser más sexuales o espeluznantes de lo que pretendía.

Para evitar estos resultados, es posible que desee utilizar más detalles al describir las personas o las escenas que desea que muestre DALL-E.

Esta pequeña solución, sin embargo, no excusa el gran problema que los modelos de aprendizaje profundo como DALL-E obtienen ideas de cosas espeluznantes que la gente comparte en línea. Las imágenes generadas por IA están cambiando el futuro del arte, pero también pueden reflejar las deficiencias de la humanidad.

5. DALL-E aún está en desarrollo

El uso del generador de arte de OpenAI ofrece muchos beneficios, desde imágenes impresionantes hasta un montón de créditos gratuitos para jugar, pero DALL-E aún es un trabajo en progreso.

Aunque ahora puede obtener muchas imágenes interesantes, es posible que desee esperar a que mejoren sus servicios. Con el tiempo, el editor debería convertirse en un placer de usar y las imágenes deficientes pueden corregirse o ser menos prominentes.

Descubra lo útiles que pueden ser las imágenes generadas por IA

Después de aprender los entresijos de DALL-E o cualquier plataforma similar, piense en cómo puede usar las imágenes que crea. Algunos proyectos requieren una redacción y una edición más cuidadosas que otros, pero los modelos de IA pueden nivelar el campo del arte y sus usos.

Por ejemplo, usted y su artista de inteligencia artificial de confianza podrían hacer sus propias ilustraciones, arte conceptual e incluso materiales educativos sin perder tiempo ni dinero. Dicho esto, también vale la pena comprender los riesgos y limitaciones de la generación de imágenes de IA.

Scroll al inicio