2022 fue un año de avance en el campo de las redes neuronales. Luego salió el famoso ChatGPT de Open AI y, por supuesto, Midjourney, una red neuronal para generar imágenes. Por supuesto, ya existían generadores de imágenes antes, pero ninguna red neuronal mostró un nivel tan alto.
Este evento ha influido en muchas industrias que requieren muchas ideas creativas y un flujo constante de imágenes. Ahora el mundo, sin exagerar, no será el mismo, y en las vacantes cada vez es más común encontrar un requisito de «habilidades de IA» o «disposición para trabajar con redes neuronales».
Porque para seguir siendo un especialista altamente calificado necesitas aprender nuevas herramientas. Hoy en este artículo veremos los diez generadores de imágenes más populares y hablaremos de sus ventajas y desventajas.
¿Qué es un generador de imágenes de IA?
Un generador de imágenes de IA, como su nombre lo indica, genera imágenes. Es importante enfatizar la palabra «genera» porque algunos chats de IA pueden buscar imágenes en internet en lugar de generarlas, mientras que las redes neuronales para la generación crean imágenes nuevas y únicas.
Estas imágenes pueden estar garantizadas para uso comercial, pero es importante tener en cuenta que en muchos países, la legislación está considerando regular cuestiones relacionadas con las redes neuronales. Un problema apremiante es la propiedad del trabajo creado por la IA, especialmente cuando la red aprende de obras existentes de autores y genera imágenes basadas en ellas sin crear nada propio.
Muchos chats basados en texto para comunicarse con la IA funcionan en conjunto con generadores de imágenes. Por ejemplo, DALL-E se puede utilizar en la comunicación con ChatGPT. En este caso, especificaremos en el artículo dónde se puede utilizar el generador.
Para generar imágenes, las redes neuronales necesitan un estímulo. Un estímulo es una descripción textual de la imagen que se desea obtener.
Dado que la inteligencia artificial todavía es bastante primitiva, la mayoría de las redes neuronales entienden bien la simplicidad técnica: conjuntos de símbolos especiales y palabras en forma de comandos, escritos a través de «;» con características de operación. Por ejemplo, el nombre del estilo en el que debería estar la imagen, sus proporciones, ajustes de cámara, colores preferidos, etc.
Podríamos hablar mucho sobre estímulos, pero hoy solo evaluaremos la facilidad de comunicación con la red neuronal.
Midjourney
En 2022, inesperadamente para todos, se lanzó Midjourney, que actualmente es la mejor red neuronal para la generación de imágenes. Anteriormente, todas las redes neuronales para trabajar con el arte solo realizaban funciones separadas: agregar un objeto a una foto o quitarlo, estilizar la imagen en diferentes estilos, envejecer a las personas en las fotos. Midjourney, por otro lado, es un nuevo nivel; con esta red, puedes generar una imagen completamente desde cero basándote en una descripción textual.
La imagen a continuación fue creada con la indicación «generar una imagen al estilo de las pinturas de Van Gogh con una chica con gafas de sol».

Capacidades y facilidad de uso
La red neuronal se actualiza constantemente, lo que dificulta rastrear lo que la versión actual de Midjourney puede hacer. Una comunidad activa de especialistas de diversos campos experimenta con las capacidades del generador, y puedes encontrar muchos ejemplos listos para trabajar, recomendaciones e incluso cursos de formación sobre cómo trabajar con esta red en línea.
Esta abundancia de información hace que trabajar con la red neuronal sea más fácil.
Vale la pena señalar que incluso sin una comunidad activa, la red neuronal es bastante fácil de trabajar, y el sitio web de los desarrolladores tiene mucho contenido educativo con ejemplos de posibles indicaciones, por lo que incluso un principiante puede entenderlo.
Adecuado para todas las profesiones sin excepción.
Calidad de la imagen
Midjourney es amado por la alta calidad de las imágenes generadas y las extensas opciones para ajustar la cámara, las proporciones del lienzo e incluso las proporciones de color y objeto en el arte terminado.
El problema inherente en todas las redes neuronales hoy en día con rarezas y elementos repetitivos también es relevante para Midjourney, pero con cada versión, se vuelve menos notable.
Por supuesto, hay errores como tres piernas en una persona o diez dedos en una mano.
A continuación, generamos una imagen con la indicación «generar una persona sin hogar con un portátil y un gato pelirrojo». Hay algunos problemas con los dedos, y el gato no es pelirrojo por alguna razón. Pero en general, la imagen es decente incluso con una indicación simple e imprecisa (Midjourney prefiere descripciones-tareas técnicas y entiende mal el lenguaje humano natural).

Rendimiento
Debido a la alta carga del servidor y la complejidad del trabajo realizado, la red neuronal siempre se retrasa. Esto es algo que se debe aceptar, ya que actualmente no hay un equivalente a Midjourney en cuanto a calidad.
Precios
Inicialmente, Midjourney solo funcionaba a través de un servidor de Discord, y cada usuario tenía veinticinco indicaciones gratuitas. Pero ahora no hay opción de usar la red neuronal de forma gratuita en absoluto; debes comprar acceso inmediatamente.

Pros y contras
Pros | Contras |
Comunidad activa, facilidad de aprendizaje | Rasgos distintivos en el estilo que hacen que la autoría de Midjourney sea fácilmente reconocible |
Alto nivel de calidad de imagen generada | No hay versión de prueba gratuita |
Amplia configuración de cámara y proporciones, capacidad para controlar cada detalle que genera la red neuronal | Opera lentamente |
Leonardo AI
Capacidades y Facilidad de Uso
Trabajar con Leonardo AI es fácil debido a la conveniente interfaz del sitio web. Entiende el lenguaje humano pero se comporta de manera extraña durante la generación. Por ejemplo, no genera nada extra: si en los ejemplos anteriores la red neuronal, al generar a una persona sin hogar con un gato y una computadora portátil, supuso que si la persona está sin hogar, entonces probablemente se siente en la calle y se ve en consecuencia, Leonardo AI generó a una persona sin hogar con una computadora portátil y un gato pelirrojo dentro de una casa en respuesta a la solicitud «generar a una persona sin hogar con una computadora portátil y un gato pelirrojo.» A continuación se muestran algunos resultados.



Por lo tanto, para trabajar con esta red neuronal, deberá estudiar cuidadosamente la indicación; de lo contrario, el resultado será inesperado. Por ejemplo, en la indicación se mencionaba un gato pelirrojo, pero Leonardo AI genera persistentemente tanto un gato pelirrojo como una persona.
Calidad de la imagen
La calidad de las imágenes deja mucho que desear. Por supuesto, con la ayuda de indicaciones precisas y palabras cuidadosamente elegidas, se puede lograr un resultado normal, pero hasta ahora, cada trabajo sigue claramente un estilo, y hay problemas con la generación de rostros y características.
A continuación se muestra una imagen generada con la indicación «generar para mí a una persona sin hogar sentada junto a un contenedor de basura en la calle, con una computadora portátil en la mano. Un gato pelirrojo está sentado a su lado, con el telón de fondo de una metrópoli».

Solo refinando al máximo el resultado obtuvimos una imagen comparable a ejemplos de redes neuronales anteriores. Los principales problemas de la red neuronal son bien notables aquí: manos en forma de salchicha, caras y rasgos torcidos, torpeza de la imagen. Curiosamente, la persona vuelve a ser pelirroja junto con el gato.
Para comparar, veamos qué sucederá con la solicitud «generar una imagen al estilo de las pinturas de Van Gogh con una chica con gafas de sol».

Rendimiento
Las imágenes se generan en promedio en diez segundos.
Precios

Ventajas y Desventajas
Ventajas | Desventajas |
Gratis para usar | Baja calidad de imagen |
Genera exactamente lo que pides, sin inventar nada «de la cabeza» | Genera exactamente lo que pides, sin inventar nada «de la cabeza» |
Interfaz conveniente con ajustes para tamaño de imagen, proporciones y otros parámetros | La versión gratuita tiene limitaciones estrictas en el número de generaciones por día |
Conclusión General
El generador tiene dificultades con tareas abiertas, pero tiene un potencial inmenso y capacidades de aprendizaje. Por ejemplo, para los videojuegos, necesitas accesorios de juego: cofres, monedas, texturas. Muestra imágenes de Leonardo AI en el estilo deseado, utiliza hábilmente las indicaciones y obtendrás un resultado bastante decente.
Inteligencia Artificial Profunda
Una red neuronal primitiva que genera imágenes de una manera extraña. El resultado es algo así como collages hechos por niños en el jardín de infantes durante una lección de creatividad. Puedes reírte de esto y olvidarlo como un mal sueño.
Capacidades y Facilidad de Uso
Trabajar con la red neuronal es fácil, pero lograr cualquier resultado decente requerirá esfuerzos titánicos.
Calidad de la imagen
Solo echemos un vistazo a la solicitud «generar para mí una persona sin hogar sentada al lado de un contenedor de basura en la calle, sosteniendo una computadora portátil. Un gato rojo está sentado a su lado, con el telón de fondo de la metrópoli».

Los problemas no se deben a una solicitud incorrecta. Si miras la galería (no recomendado por la noche, para mujeres embarazadas y niños) de imágenes en el sitio web, puedes ver que todas las imágenes son igualmente absurdas.
Velocidad
Generación instantánea.
Costo
La versión gratuita permite acceder a todas las funciones básicas de la red neuronal. Las características específicas en PRO por $5 al mes son desconocidas.
Pros y contras
Pros | Contras |
Puede ser divertido | Calidad de imagen muy baja |
Parcialmente de pago |
Canva AI
Canva, una herramienta líder para crear creatividades en diseño, branding y otras industrias, ha lanzado la herramienta Canva AI.
Características y facilidad de uso
Ahora, en la versión PRO, junto con otras herramientas, ha aparecido un campo para ingresar un texto de solicitud en el panel izquierdo del sitio al crear un diseño. Canva AI comprende el lenguaje natural, por lo que no es necesario aprender una solicitud para obtener un buen resultado.
El generador está diseñado con un solo propósito: acelerar y mejorar el proceso de creación de contenido de diseño, haciéndolo exclusivamente adecuado para estos fines.
Calidad de la imagen
La calidad de la imagen puede que no siempre sea la esperada, pero considerando que Canva AI fue lanzado recientemente, esto es perdonable. A continuación se muestran ejemplos de imágenes generadas por esta IA.




Velocidad
La generación es casi instantánea.
Costo
Canva AI está incluido en la suscripción PRO en Canva.
Pros y contras
Pros | Contras |
Buena herramienta para diseñadores | Pago |
Versión de prueba gratuita de un mes disponible |
NightCafe
NightCafe es una herramienta con capacidades muy amplias para la generación de imágenes. Combina muchas redes neuronales avanzadas y permite crear tus propios estilos basados en ellas.
Capacidades y facilidad de uso
Hay una comunidad sustancial alrededor de NightCafe, lo que facilita hacer preguntas interesantes, buscar ayuda con indicaciones, etc. El sistema del generador fomenta la cohesión al proporcionar créditos adicionales cuando las imágenes se publican en la comunidad.
NightCafe tiene una interfaz y sistema de generación muy amigables para el usuario, lo que lo hace adecuado también para principiantes.
Calidad de las imágenes
Comparar la calidad de las imágenes con redes neuronales avanzadas es actualmente un desafío. Sin embargo, se cree que NightCafe pronto alcanzará a sus competidores y proporcionará una fuerte competencia. El generador tiene todo lo que necesita: una comunidad cohesionada, una oferta única de múltiples redes neuronales dentro de un solo proyecto, un sistema para crear estilos de forma independiente y la capacidad de publicar indicaciones en el sitio web para que otros las utilicen.
Incluso ahora, no se puede decir que todo sea malo. Pero para lograr buenos resultados, definitivamente será necesario estudiar cuidadosamente el generador y encontrar la forma más efectiva de interactuar.
La primera imagen fue creada con la indicación «crear una imagen para mí en el estilo de las pinturas de Van Gogh con una chica usando gafas de sol».

Crear una imagen con una persona sin hogar y una computadora portátil resultó ser mucho más desafiante. Lo más probable es que la inteligencia artificial todavía tenga dificultades para entender el lenguaje natural, a pesar de afirmar lo contrario, de ahí las dificultades. Sin embargo, si pasamos por alto el rostro de un gato en lugar de un rostro humano y errores similares debido a inexactitudes en la indicación, el trabajo parece más que satisfactorio.
Indicación de generación a continuación: «crear una persona sin hogar con una computadora portátil y un gato pelirrojo».

Generación de indicaciones a continuación: «crear a una persona sin hogar sentada junto a un contenedor de basura en la calle, con una computadora portátil en la mano. Un gato pelirrojo está sentado cerca».


Velocidad de operación
10-15 segundos.
Precios
Una versión gratuita está disponible con sus limitaciones. El número de usos en la versión gratuita está restringido, pero créditos adicionales (las imágenes se generan por crédito) se pueden obtener publicando generaciones en la comunidad y otras acciones.
Pros y contras
Pros | Cons |
Capacidad para crear y compartir tus estilos con los usuarios | Requiere introducir un comando técnico exacto, no comprende bien el lenguaje natural |
Amplias capacidades con múltiples modelos de redes neuronales bajo una sola interfaz | Problemas con la representación de caras, manos y pequeños detalles |
Capacidad de uso gratuito | Requiere una versión de pago para funcionalidad completa |
Creador de imágenes de Bing
Microsoft ha lanzado su motor de búsqueda con ChatGPT y, en consecuencia, la capacidad de generar imágenes usando DALL-E.
Capacidades y facilidad de uso
Anteriormente escribimos sobre DALL-E como el primero en nuestra lista principal, y dado que Bing Image Creator es un completo análogo de este generador, no es necesario describirlo todo de nuevo. Toda la información se puede encontrar arriba.
A continuación se muestran imágenes generadas en Bing Image Creator. No son diferentes de DALL-E.


Arte de Jasper
El Arte de Jasper es un producto de la misma empresa que creó Jasper Chat. El primero se utiliza al ingresar solicitudes en el chat como «generar para mí», es decir, al igual que DALL-E, está completamente integrado con Jasper Chat.
Capacidades y Facilidad de Uso
Desafortunadamente, no podemos examinar de forma independiente cómo funciona Jasper Art, ya que la versión gratuita solo está disponible después de ingresar los detalles de pago. En teoría, debería interactuar bien basado en un lenguaje humano simple, pero los usuarios en internet se quejan de que la red neuronal entiende mal lo que una persona quiere obtener de ella.
Calidad de la imagen
Los usuarios en internet señalan que la calidad de la imagen actualmente deja mucho que desear. A juzgar por Jasper Chat, es probable que el generador de imágenes mejore pronto.
Velocidad
La velocidad de operación es desconocida.
Precios

Pros y contras
Pros | Cons |
Una alternativa a ChatGPT con DALL-E. Actualmente no coincide con el nivel de generación de imágenes, pero el generador está en constante evolución. | La red neuronal no entiende lo que se espera de ella. |
Prueba gratuita por una semana. | Requiere pago. |
Starry AI
Al ingresar al sitio y registrarse, se nos presentan cuatro opciones para generaciones: dibujos, fotos, ilustraciones y crear tu propio estilo. En general, la red neuronal tiene una interfaz minimalista y muy amigable para el usuario.
Capacidades y Facilidad de Uso
La red neuronal prefiere indicaciones técnicas precisas en lugar de un lenguaje humano natural, por lo que es difícil comunicarse con ella de manera normal. Se notan todos los problemas típicos de las redes neuronales: diez dedos, elementos repetitivos y ojos y caras extrañas.
Ante la solicitud «genera una persona sin hogar con una computadora portátil y un gato pelirrojo para mí», obtuvimos esto:

Curiosamente, la persona está sosteniendo una computadora portátil de Apple y levitando. Pero un momento intrigante: no hubo problemas con el color del cabello que coincidiera con el gato o generara la cara de un gato en lugar de una cara humana. Sin embargo, en algunas variaciones, el gato desapareció por completo.
Calidad de la imagen
Lo más probable es que, si profundizas en el generador, puedas lograr buenos resultados. Sin embargo, solo puedes crear hasta dos imágenes al día, o tendrás que comprar una cuenta PRO.
En una solicitud más simple como «generar una imagen al estilo de las pinturas de Van Gogh con una chica con gafas de sol», obtuvimos esta imagen:

Rendimiento
Starry AI genera imágenes más lentamente que otros generadores, alrededor de 30 segundos. La versión de computadora tiene retrasos significativos en todas las etapas de trabajo: problemas con el registro, inicio del proceso y descarga de imágenes terminadas.
Precios
La cuenta PRO cuesta 9 dólares al mes. Una aplicación móvil está disponible para cualquier dispositivo.
Pros y contras
Pros | Cons |
Desarrollo, calidad decente de generaciones | Funciona lentamente |
Interfaz minimalista conveniente | Requiere pago |
Dream Studio (Difusión Estable)
Dream Studio es una interfaz para usar la red neuronal de generación de imágenes de Difusión Estable.
Capacidades y Facilidad de Uso
Si Diffusion Stable es una red neuronal «pesada» que solo se puede instalar en una computadora potente, Dream Studio te permite usar el generador directamente en su sitio web minimalista y fácil de usar con opciones de estilo, formatos de imagen y más.
Calidad de la imagen
No pudimos verificar manualmente la calidad de la imagen debido a la dificultad de acceder a esta red neuronal. Dado que se trata de una interfaz de usuario y está en modo de prueba, pueden surgir dificultades similares. Sin embargo, la galería de imágenes generadas luce impresionante.
Velocidad de operación
Desconocida.
Costo
Inicialmente, el usuario tiene acceso a cien créditos, aproximadamente 500 generaciones gratuitas. Esta cantidad es suficiente para explorar completamente las capacidades del sitio y decidir si comprar créditos. 1000 créditos cuestan solo 10 dólares.
Ventajas y desventajas
Pros | Cons |
Buena calidad de imagen | Problemas de registro |
Interfaz fácil de usar | Parcialmente pagado |
Conclusión
En el mundo, hay una lucha ética entre los creadores de contenido y la inteligencia artificial, y las empresas constantemente introducen nuevas reglas para el uso de la inteligencia artificial en su trabajo (especialmente en cuanto a concursos, obras premiadas, etc.). Se desconoce cómo terminará esta guerra ética, pero saber usar generadores de manera hábil y reflexiva es una habilidad útil que pronto será requerida para cualquier trabajo relevante. La clave no es crear mecánicamente imágenes y hacerlas pasar por arte, sino usar la inteligencia artificial como una herramienta para mejorar la eficiencia de una persona viva.