Los 10 mejores generadores de imágenes de IA en 2024

Tabla de Contenidos

2022 fue un año de avance en el campo de las redes neuronales. Luego salió el famoso ChatGPT de Open AI y, por supuesto, Midjourney, una red neuronal para generar imágenes. Por supuesto, ya existían generadores de imágenes antes, pero ninguna red neuronal mostró un nivel tan alto.

Este evento ha influido en muchas industrias que requieren muchas ideas creativas y un flujo constante de imágenes. Ahora el mundo, sin exagerar, no será el mismo, y en las vacantes cada vez es más común encontrar un requisito de «habilidades de IA» o «disposición para trabajar con redes neuronales».

Porque para seguir siendo un especialista altamente calificado necesitas aprender nuevas herramientas. Hoy en este artículo veremos los diez generadores de imágenes más populares y hablaremos de sus ventajas y desventajas.

¿Qué es un generador de imágenes de IA?

Un generador de imágenes de IA, como su nombre lo indica, genera imágenes. Es importante enfatizar la palabra «genera» porque algunos chats de IA pueden buscar imágenes en internet en lugar de generarlas, mientras que las redes neuronales para la generación crean imágenes nuevas y únicas.

Estas imágenes pueden estar garantizadas para uso comercial, pero es importante tener en cuenta que en muchos países, la legislación está considerando regular cuestiones relacionadas con las redes neuronales. Un problema apremiante es la propiedad del trabajo creado por la IA, especialmente cuando la red aprende de obras existentes de autores y genera imágenes basadas en ellas sin crear nada propio.

Muchos chats basados en texto para comunicarse con la IA funcionan en conjunto con generadores de imágenes. Por ejemplo, DALL-E se puede utilizar en la comunicación con ChatGPT. En este caso, especificaremos en el artículo dónde se puede utilizar el generador.

Para generar imágenes, las redes neuronales necesitan un estímulo. Un estímulo es una descripción textual de la imagen que se desea obtener.

Dado que la inteligencia artificial todavía es bastante primitiva, la mayoría de las redes neuronales entienden bien la simplicidad técnica: conjuntos de símbolos especiales y palabras en forma de comandos, escritos a través de «;» con características de operación. Por ejemplo, el nombre del estilo en el que debería estar la imagen, sus proporciones, ajustes de cámara, colores preferidos, etc.

Podríamos hablar mucho sobre estímulos, pero hoy solo evaluaremos la facilidad de comunicación con la red neuronal.

Midjourney

En 2022, inesperadamente para todos, se lanzó Midjourney, que actualmente es la mejor red neuronal para la generación de imágenes. Anteriormente, todas las redes neuronales para trabajar con el arte solo realizaban funciones separadas: agregar un objeto a una foto o quitarlo, estilizar la imagen en diferentes estilos, envejecer a las personas en las fotos. Midjourney, por otro lado, es un nuevo nivel; con esta red, puedes generar una imagen completamente desde cero basándote en una descripción textual.

La imagen a continuación fue creada con la indicación «generar una imagen al estilo de las pinturas de Van Gogh con una chica con gafas de sol».

Capacidades y facilidad de uso

La red neuronal se actualiza constantemente, lo que dificulta rastrear lo que la versión actual de Midjourney puede hacer. Una comunidad activa de especialistas de diversos campos experimenta con las capacidades del generador, y puedes encontrar muchos ejemplos listos para trabajar, recomendaciones e incluso cursos de formación sobre cómo trabajar con esta red en línea.

Esta abundancia de información hace que trabajar con la red neuronal sea más fácil.

Vale la pena señalar que incluso sin una comunidad activa, la red neuronal es bastante fácil de trabajar, y el sitio web de los desarrolladores tiene mucho contenido educativo con ejemplos de posibles indicaciones, por lo que incluso un principiante puede entenderlo.

Adecuado para todas las profesiones sin excepción.

Calidad de la imagen

Midjourney es amado por la alta calidad de las imágenes generadas y las extensas opciones para ajustar la cámara, las proporciones del lienzo e incluso las proporciones de color y objeto en el arte terminado.

El problema inherente en todas las redes neuronales hoy en día con rarezas y elementos repetitivos también es relevante para Midjourney, pero con cada versión, se vuelve menos notable.

Por supuesto, hay errores como tres piernas en una persona o diez dedos en una mano.

A continuación, generamos una imagen con la indicación «generar una persona sin hogar con un portátil y un gato pelirrojo». Hay algunos problemas con los dedos, y el gato no es pelirrojo por alguna razón. Pero en general, la imagen es decente incluso con una indicación simple e imprecisa (Midjourney prefiere descripciones-tareas técnicas y entiende mal el lenguaje humano natural).

Rendimiento

Debido a la alta carga del servidor y la complejidad del trabajo realizado, la red neuronal siempre se retrasa. Esto es algo que se debe aceptar, ya que actualmente no hay un equivalente a Midjourney en cuanto a calidad.

Precios

Inicialmente, Midjourney solo funcionaba a través de un servidor de Discord, y cada usuario tenía veinticinco indicaciones gratuitas. Pero ahora no hay opción de usar la red neuronal de forma gratuita en absoluto; debes comprar acceso inmediatamente.

Pros y contras

Pros	Contras
Comunidad activa, facilidad de aprendizaje	Rasgos distintivos en el estilo que hacen que la autoría de Midjourney sea fácilmente reconocible
Alto nivel de calidad de imagen generada	No hay versión de prueba gratuita
Amplia configuración de cámara y proporciones, capacidad para controlar cada detalle que genera la red neuronal	Opera lentamente

Leonardo AI

Capacidades y Facilidad de Uso

Trabajar con Leonardo AI es fácil debido a la conveniente interfaz del sitio web. Entiende el lenguaje humano pero se comporta de manera extraña durante la generación. Por ejemplo, no genera nada extra: si en los ejemplos anteriores la red neuronal, al generar a una persona sin hogar con un gato y una computadora portátil, supuso que si la persona está sin hogar, entonces probablemente se siente en la calle y se ve en consecuencia, Leonardo AI generó a una persona sin hogar con una computadora portátil y un gato pelirrojo dentro de una casa en respuesta a la solicitud «generar a una persona sin hogar con una computadora portátil y un gato pelirrojo.» A continuación se muestran algunos resultados.

ejemplo de inteligencia artificial de leonardo

Por lo tanto, para trabajar con esta red neuronal, deberá estudiar cuidadosamente la indicación; de lo contrario, el resultado será inesperado. Por ejemplo, en la indicación se mencionaba un gato pelirrojo, pero Leonardo AI genera persistentemente tanto un gato pelirrojo como una persona.

Calidad de la imagen

La calidad de las imágenes deja mucho que desear. Por supuesto, con la ayuda de indicaciones precisas y palabras cuidadosamente elegidas, se puede lograr un resultado normal, pero hasta ahora, cada trabajo sigue claramente un estilo, y hay problemas con la generación de rostros y características.
A continuación se muestra una imagen generada con la indicación «generar para mí a una persona sin hogar sentada junto a un contenedor de basura en la calle, con una computadora portátil en la mano. Un gato pelirrojo está sentado a su lado, con el telón de fondo de una metrópoli».

Solo refinando al máximo el resultado obtuvimos una imagen comparable a ejemplos de redes neuronales anteriores. Los principales problemas de la red neuronal son bien notables aquí: manos en forma de salchicha, caras y rasgos torcidos, torpeza de la imagen. Curiosamente, la persona vuelve a ser pelirroja junto con el gato.

Para comparar, veamos qué sucederá con la solicitud «generar una imagen al estilo de las pinturas de Van Gogh con una chica con gafas de sol».

Rendimiento

Las imágenes se generan en promedio en diez segundos.

Precios

Ventajas y Desventajas

Ventajas	Desventajas
Gratis para usar	Baja calidad de imagen
Genera exactamente lo que pides, sin inventar nada «de la cabeza»	Genera exactamente lo que pides, sin inventar nada «de la cabeza»
Interfaz conveniente con ajustes para tamaño de imagen, proporciones y otros parámetros	La versión gratuita tiene limitaciones estrictas en el número de generaciones por día

Conclusión General

El generador tiene dificultades con tareas abiertas, pero tiene un potencial inmenso y capacidades de aprendizaje. Por ejemplo, para los videojuegos, necesitas accesorios de juego: cofres, monedas, texturas. Muestra imágenes de Leonardo AI en el estilo deseado, utiliza hábilmente las indicaciones y obtendrás un resultado bastante decente.

Inteligencia Artificial Profunda

Una red neuronal primitiva que genera imágenes de una manera extraña. El resultado es algo así como collages hechos por niños en el jardín de infantes durante una lección de creatividad. Puedes reírte de esto y olvidarlo como un mal sueño.

Capacidades y Facilidad de Uso

Trabajar con la red neuronal es fácil, pero lograr cualquier resultado decente requerirá esfuerzos titánicos.

Calidad de la imagen

Solo echemos un vistazo a la solicitud «generar para mí una persona sin hogar sentada al lado de un contenedor de basura en la calle, sosteniendo una computadora portátil. Un gato rojo está sentado a su lado, con el telón de fondo de la metrópoli».

Los problemas no se deben a una solicitud incorrecta. Si miras la galería (no recomendado por la noche, para mujeres embarazadas y niños) de imágenes en el sitio web, puedes ver que todas las imágenes son igualmente absurdas.

Velocidad

Generación instantánea.

Costo

La versión gratuita permite acceder a todas las funciones básicas de la red neuronal. Las características específicas en PRO por $5 al mes son desconocidas.

Pros y contras

Pros	Contras
Puede ser divertido	Calidad de imagen muy baja
	Parcialmente de pago

Canva AI

Canva, una herramienta líder para crear creatividades en diseño, branding y otras industrias, ha lanzado la herramienta Canva AI.

Características y facilidad de uso

Ahora, en la versión PRO, junto con otras herramientas, ha aparecido un campo para ingresar un texto de solicitud en el panel izquierdo del sitio al crear un diseño. Canva AI comprende el lenguaje natural, por lo que no es necesario aprender una solicitud para obtener un buen resultado.

El generador está diseñado con un solo propósito: acelerar y mejorar el proceso de creación de contenido de diseño, haciéndolo exclusivamente adecuado para estos fines.

Calidad de la imagen

La calidad de la imagen puede que no siempre sea la esperada, pero considerando que Canva AI fue lanzado recientemente, esto es perdonable. A continuación se muestran ejemplos de imágenes generadas por esta IA.

ejemplo de inteligencia artificial de Canva

Velocidad

La generación es casi instantánea.

Costo

Canva AI está incluido en la suscripción PRO en Canva.

Pros y contras

Pros	Contras
Buena herramienta para diseñadores	Pago
Versión de prueba gratuita de un mes disponible

NightCafe

NightCafe es una herramienta con capacidades muy amplias para la generación de imágenes. Combina muchas redes neuronales avanzadas y permite crear tus propios estilos basados en ellas.

Capacidades y facilidad de uso

Hay una comunidad sustancial alrededor de NightCafe, lo que facilita hacer preguntas interesantes, buscar ayuda con indicaciones, etc. El sistema del generador fomenta la cohesión al proporcionar créditos adicionales cuando las imágenes se publican en la comunidad.

NightCafe tiene una interfaz y sistema de generación muy amigables para el usuario, lo que lo hace adecuado también para principiantes.

Calidad de las imágenes

Comparar la calidad de las imágenes con redes neuronales avanzadas es actualmente un desafío. Sin embargo, se cree que NightCafe pronto alcanzará a sus competidores y proporcionará una fuerte competencia. El generador tiene todo lo que necesita: una comunidad cohesionada, una oferta única de múltiples redes neuronales dentro de un solo proyecto, un sistema para crear estilos de forma independiente y la capacidad de publicar indicaciones en el sitio web para que otros las utilicen.

Incluso ahora, no se puede decir que todo sea malo. Pero para lograr buenos resultados, definitivamente será necesario estudiar cuidadosamente el generador y encontrar la forma más efectiva de interactuar.

La primera imagen fue creada con la indicación «crear una imagen para mí en el estilo de las pinturas de Van Gogh con una chica usando gafas de sol».

ejemplo de inteligencia artificial en el café nocturno

Crear una imagen con una persona sin hogar y una computadora portátil resultó ser mucho más desafiante. Lo más probable es que la inteligencia artificial todavía tenga dificultades para entender el lenguaje natural, a pesar de afirmar lo contrario, de ahí las dificultades. Sin embargo, si pasamos por alto el rostro de un gato en lugar de un rostro humano y errores similares debido a inexactitudes en la indicación, el trabajo parece más que satisfactorio.

Indicación de generación a continuación: «crear una persona sin hogar con una computadora portátil y un gato pelirrojo».

Generación de indicaciones a continuación: «crear a una persona sin hogar sentada junto a un contenedor de basura en la calle, con una computadora portátil en la mano. Un gato pelirrojo está sentado cerca».

ejemplo de inteligencia artificial de nightcafe

Velocidad de operación

10-15 segundos.

Precios

Una versión gratuita está disponible con sus limitaciones. El número de usos en la versión gratuita está restringido, pero créditos adicionales (las imágenes se generan por crédito) se pueden obtener publicando generaciones en la comunidad y otras acciones.

Pros y contras

Pros	Cons
Capacidad para crear y compartir tus estilos con los usuarios	Requiere introducir un comando técnico exacto, no comprende bien el lenguaje natural
Amplias capacidades con múltiples modelos de redes neuronales bajo una sola interfaz	Problemas con la representación de caras, manos y pequeños detalles
Capacidad de uso gratuito	Requiere una versión de pago para funcionalidad completa

Creador de imágenes de Bing

Microsoft ha lanzado su motor de búsqueda con ChatGPT y, en consecuencia, la capacidad de generar imágenes usando DALL-E.

Capacidades y facilidad de uso

Anteriormente escribimos sobre DALL-E como el primero en nuestra lista principal, y dado que Bing Image Creator es un completo análogo de este generador, no es necesario describirlo todo de nuevo. Toda la información se puede encontrar arriba.

A continuación se muestran imágenes generadas en Bing Image Creator. No son diferentes de DALL-E.

ejemplo de imagen de inteligencia artificial de bing

Arte de Jasper

El Arte de Jasper es un producto de la misma empresa que creó Jasper Chat. El primero se utiliza al ingresar solicitudes en el chat como «generar para mí», es decir, al igual que DALL-E, está completamente integrado con Jasper Chat.

Capacidades y Facilidad de Uso

Desafortunadamente, no podemos examinar de forma independiente cómo funciona Jasper Art, ya que la versión gratuita solo está disponible después de ingresar los detalles de pago. En teoría, debería interactuar bien basado en un lenguaje humano simple, pero los usuarios en internet se quejan de que la red neuronal entiende mal lo que una persona quiere obtener de ella.

Calidad de la imagen

Los usuarios en internet señalan que la calidad de la imagen actualmente deja mucho que desear. A juzgar por Jasper Chat, es probable que el generador de imágenes mejore pronto.

Velocidad

La velocidad de operación es desconocida.

Precios

Pros y contras

Pros	Cons
Una alternativa a ChatGPT con DALL-E. Actualmente no coincide con el nivel de generación de imágenes, pero el generador está en constante evolución.	La red neuronal no entiende lo que se espera de ella.
Prueba gratuita por una semana.	Requiere pago.

Starry AI

Al ingresar al sitio y registrarse, se nos presentan cuatro opciones para generaciones: dibujos, fotos, ilustraciones y crear tu propio estilo. En general, la red neuronal tiene una interfaz minimalista y muy amigable para el usuario.

Capacidades y Facilidad de Uso

La red neuronal prefiere indicaciones técnicas precisas en lugar de un lenguaje humano natural, por lo que es difícil comunicarse con ella de manera normal. Se notan todos los problemas típicos de las redes neuronales: diez dedos, elementos repetitivos y ojos y caras extrañas.

Ante la solicitud «genera una persona sin hogar con una computadora portátil y un gato pelirrojo para mí», obtuvimos esto:

Ejemplo de inteligencia artificial estrellada

Curiosamente, la persona está sosteniendo una computadora portátil de Apple y levitando. Pero un momento intrigante: no hubo problemas con el color del cabello que coincidiera con el gato o generara la cara de un gato en lugar de una cara humana. Sin embargo, en algunas variaciones, el gato desapareció por completo.

Calidad de la imagen

Lo más probable es que, si profundizas en el generador, puedas lograr buenos resultados. Sin embargo, solo puedes crear hasta dos imágenes al día, o tendrás que comprar una cuenta PRO.

En una solicitud más simple como «generar una imagen al estilo de las pinturas de Van Gogh con una chica con gafas de sol», obtuvimos esta imagen:

Rendimiento

Starry AI genera imágenes más lentamente que otros generadores, alrededor de 30 segundos. La versión de computadora tiene retrasos significativos en todas las etapas de trabajo: problemas con el registro, inicio del proceso y descarga de imágenes terminadas.

Precios

La cuenta PRO cuesta 9 dólares al mes. Una aplicación móvil está disponible para cualquier dispositivo.

Pros y contras

Pros	Cons
Desarrollo, calidad decente de generaciones	Funciona lentamente
Interfaz minimalista conveniente	Requiere pago

Dream Studio (Difusión Estable)

Dream Studio es una interfaz para usar la red neuronal de generación de imágenes de Difusión Estable.

Capacidades y Facilidad de Uso

Si Diffusion Stable es una red neuronal «pesada» que solo se puede instalar en una computadora potente, Dream Studio te permite usar el generador directamente en su sitio web minimalista y fácil de usar con opciones de estilo, formatos de imagen y más.

Calidad de la imagen

No pudimos verificar manualmente la calidad de la imagen debido a la dificultad de acceder a esta red neuronal. Dado que se trata de una interfaz de usuario y está en modo de prueba, pueden surgir dificultades similares. Sin embargo, la galería de imágenes generadas luce impresionante.

Velocidad de operación

Desconocida.

Costo

Inicialmente, el usuario tiene acceso a cien créditos, aproximadamente 500 generaciones gratuitas. Esta cantidad es suficiente para explorar completamente las capacidades del sitio y decidir si comprar créditos. 1000 créditos cuestan solo 10 dólares.

Ventajas y desventajas

Pros	Cons
Buena calidad de imagen	Problemas de registro
Interfaz fácil de usar	Parcialmente pagado

Conclusión

En el mundo, hay una lucha ética entre los creadores de contenido y la inteligencia artificial, y las empresas constantemente introducen nuevas reglas para el uso de la inteligencia artificial en su trabajo (especialmente en cuanto a concursos, obras premiadas, etc.). Se desconoce cómo terminará esta guerra ética, pero saber usar generadores de manera hábil y reflexiva es una habilidad útil que pronto será requerida para cualquier trabajo relevante. La clave no es crear mecánicamente imágenes y hacerlas pasar por arte, sino usar la inteligencia artificial como una herramienta para mejorar la eficiencia de una persona viva.