Top 10 KI-Bildgeneratoren im Jahr 2024

Inhaltsverzeichnis

2022 war ein Durchbruchsjahr auf dem Gebiet der neuronalen Netzwerke. Dann kam der berühmte ChatGPT von Open AI und natürlich Midjourney, ein neuronales Netzwerk zur Generierung von Bildern, heraus. Natürlich gab es schon zuvor Bildgeneratoren, aber kein einziges neuronales Netzwerk zeigte ein solches Niveau.

Dieses Ereignis hat viele Branchen beeinflusst, die viele kreative Ideen und einen ständigen Fluss von Bildern erfordern. Jetzt wird die Welt, ohne Übertreibung, nicht mehr dieselbe sein, und in Stellenausschreibungen findet man immer häufiger Anforderungen an „KI-Fähigkeiten“ oder „Bereitschaft zur Arbeit mit neuronalen Netzwerken“.

Denn um weiterhin ein hochqualifizierter Spezialist zu sein, müssen Sie neue Werkzeuge lernen. Heute werden wir in diesem Artikel die zehn beliebtesten Bildgeneratoren betrachten und über ihre Vor- und Nachteile sprechen.

Was ist ein KI-Bildgenerator

Ein KI-Bildgenerator generiert, wie der Name schon sagt, Bilder. Es ist wichtig, das Wort „generiert“ zu betonen, da einige KI-Chats möglicherweise im Internet nach Bildern suchen, anstatt sie zu generieren, während neuronale Netzwerke zur Generierung neue, einzigartige Bilder erstellen.

Solche Bilder können für den kommerziellen Gebrauch garantiert werden, aber es ist wichtig zu beachten, dass in vielen Ländern die Gesetzgebung die Regulierung von Problemen im Zusammenhang mit neuronalen Netzwerken in Betracht zieht. Ein drängendes Problem ist das Eigentum an den Werken, die von KI erstellt wurden, insbesondere wenn das Netzwerk von bestehenden Werken von Autoren lernt und Bilder basierend auf ihnen generiert, ohne etwas Eigenes zu schaffen.

Viele textbasierte Chats zur Kommunikation mit KI arbeiten in Verbindung mit Bildgeneratoren. Zum Beispiel kann DALL-E in der Kommunikation mit ChatGPT verwendet werden. In diesem Fall werden wir im Artikel angeben, wo der Generator verwendet werden kann.

Zur Generierung von Bildern benötigen neuronale Netzwerke einen Anstoß. Ein Anstoß ist eine textuelle Beschreibung des Bildes, das Sie erhalten möchten.

Da künstliche Intelligenz noch recht primitiv ist, verstehen die meisten neuronalen Netzwerke technische Einfachheit gut – Sets von speziellen Symbolen und Wörtern in Form von Befehlen, die durch „;“ mit Betriebsmerkmalen geschrieben sind. Zum Beispiel der Stilname, in dem das Bild sein sollte, seine Proportionen, Kameraeinstellungen, bevorzugte Farben usw.

Wir könnten viel über Anstöße sprechen, aber heute werden wir nur die Leichtigkeit der Kommunikation mit dem neuronalen Netzwerk bewerten.

Midjourney

Im Jahr 2022 wurde überraschenderweise Midjourney veröffentlicht, das derzeit beste neuronale Netzwerk zur Bildgenerierung. Zuvor führten alle neuronalen Netzwerke zur Arbeit mit Kunst nur separate Funktionen aus: das Hinzufügen eines Objekts zu einem Foto oder das Entfernen davon, die Stilisierung des Bildes in verschiedenen Stilen, das Altern von Personen auf Fotos. Midjourney hingegen ist ein neues Level; mit diesem Netzwerk können Sie ein Bild vollständig aus einer textuellen Beschreibung generieren.

Das untenstehende Bild wurde mit der Anweisung „Generieren Sie ein Bild im Stil von Van Goghs Gemälden mit einem Mädchen in Sonnenbrille“ erstellt.

Fähigkeiten und Benutzerfreundlichkeit

Das neuronale Netzwerk wird ständig aktualisiert, was es schwierig macht, zu verfolgen, was die aktuelle Version von Midjourney kann. Eine aktive Community von Spezialisten aus verschiedenen Bereichen experimentiert mit den Fähigkeiten des Generators, und Sie können viele fertige Vorgaben für die Arbeit oder Empfehlungen und sogar Schulungskurse zur Arbeit mit diesem Netzwerk online finden.

Diese Fülle an Informationen erleichtert die Arbeit mit dem neuronalen Netzwerk.

Es ist erwähnenswert, dass selbst ohne eine aktive Community das neuronale Netzwerk recht einfach zu handhaben ist und die Website der Entwickler viele Bildungsinhalte mit Beispielen möglicher Eingaben enthält, sodass auch Anfänger es verstehen können.

Geeignet für alle Berufe ohne Ausnahme.

Bildqualität

Midjourney wird für die hohe Qualität der generierten Bilder und umfangreiche Optionen zur Anpassung der Kamera, der Leinwandproportionen und sogar der Farb- und Objektproportionen in der fertigen Kunst geliebt.

Das Problem, das allen neuronalen Netzwerken heute mit Eigenheiten und sich wiederholenden Elementen eigen ist, ist auch für Midjourney relevant, aber mit jeder Version wird es weniger auffällig.

Natürlich gibt es Fehler wie drei Beine an einer Person oder zehn Finger an einer Hand.

Unten haben wir ein Bild mit der Aufforderung „Generiere eine obdachlose Person mit einem Laptop und einer roten Katze“ erstellt. Es gibt einige Probleme mit den Fingern, und die Katze ist aus irgendeinem Grund nicht rot. Aber insgesamt ist das Bild auch mit einer einfachen und ungenauen Aufforderung anständig (Midjourney bevorzugt technische Beschreibungen-Befehle und versteht natürliche menschliche Sprache schlecht).

Leistung

Aufgrund der hohen Serverlast und der Komplexität der durchgeführten Arbeiten hinkt das neuronale Netzwerk kontinuierlich hinterher. Dies ist etwas, das akzeptiert werden muss, da es derzeit keine Äquivalente zu Midjourney in Bezug auf Qualität gibt.

Preisgestaltung

Anfangs funktionierte Midjourney nur über einen Discord-Server, und jeder Benutzer hatte fünfundzwanzig kostenlose Anfragen. Aber jetzt gibt es überhaupt keine Möglichkeit mehr, das neuronale Netzwerk kostenlos zu nutzen; Sie müssen sofort Zugang kaufen.

Vor- und Nachteile

Pro	Kontra
Aktive Community, einfaches Erlernen	Charakteristische Merkmale im Stil, die die Autorenschaft von Midjourney leicht erkennbar machen
Hohes Maß an generierter Bildqualität	Keine kostenlose Testversion
Umfangreiche Kamera- und Proportionseinstellungen, Möglichkeit, jedes Detail zu steuern, das das neuronale Netzwerk generiert	Arbeitet langsam

Leonardo KI

Fähigkeiten und Benutzerfreundlichkeit

Die Arbeit mit Leonardo AI ist aufgrund der benutzerfreundlichen Website-Schnittstelle einfach. Es versteht die menschliche Sprache, verhält sich jedoch während der Generierung seltsam. Zum Beispiel generiert es nichts Extra: Wenn das neuronale Netzwerk in den obigen Beispielen beim Generieren einer obdachlosen Person mit einer Katze und einem Laptop erraten hätte, dass die Person obdachlos ist, dann wahrscheinlich auf der Straße sitzt und entsprechend aussieht, generierte Leonardo AI als Antwort auf die Anfrage „generiere eine obdachlose Person mit einem Laptop und einer roten Katze“ eine obdachlose Person mit einem Laptop und einer roten Katze im Haus. Unten sind einige Ergebnisse.

Daher müssen Sie zur Arbeit mit diesem neuronalen Netzwerk sorgfältig die Anweisung studieren; andernfalls wird das Ergebnis unerwartet sein. Zum Beispiel wurde in der Anweisung von einer roten Katze gesprochen, aber Leonardo KI generiert hartnäckig sowohl eine rote Katze als auch eine Person.

Bildqualität

Die Qualität der Bilder lässt viel zu wünschen übrig. Natürlich kann man mit genauen Anweisungen und sorgfältig gewählten Worten ein normales Ergebnis erzielen, aber bisher folgt jede Arbeit eindeutig einem Stil, und es gibt Probleme bei der Generierung von Gesichtern und Merkmalen.
Unten ist ein Bild mit der Anweisung generiert „Generiere für mich eine obdachlose Person, die neben einem Müllcontainer auf der Straße sitzt, mit einem Laptop in der Hand. Ein rothaariger Kater sitzt neben ihm, vor dem Hintergrund einer Metropole.“

Nur durch Maximierung des Ergebnisses haben wir ein Bild erhalten, das mit Beispielen aus früheren neuronalen Netzwerken vergleichbar ist. Die Hauptprobleme des neuronalen Netzwerks sind hier gut erkennbar: wurstähnliche Hände, krumme Gesichter und Merkmale, Ungeschicklichkeit des Bildes. Interessanterweise ist die Person wieder rothaarig zusammen mit der Katze.

Zum Vergleich, schauen wir, was passieren wird mit der Anfrage „Generieren Sie ein Bild im Stil von Van Goghs Gemälden mit einem Mädchen in Sonnenbrille“.

Leistung

Bilder werden im Durchschnitt innerhalb von zehn Sekunden generiert.

Preisgestaltung

Vor- und Nachteile

Vorteile	Nachteile
Kostenlos zu benutzen	Niedrige Bildqualität
Generiert genau das, was Sie verlangen, ohne etwas „aus dem Kopf“ zu erfinden	Generiert genau das, was Sie verlangen, ohne etwas „aus dem Kopf“ zu erfinden
Bequeme Benutzeroberfläche mit Einstellungen für Bildgröße, Proportionen und andere Parameter	Die kostenlose Version hat strenge Einschränkungen hinsichtlich der Anzahl der Generierungen pro Tag

Gesamtfazit

Der Generator hat Schwierigkeiten mit offenen Aufgaben, aber er hat ein enormes Potenzial und Lernfähigkeiten. Zum Beispiel benötigen Sie für Spiele Spielelemente – Truhen, Münzen, Texturen. Zeigen Sie Leonardo AI-Bilder im gewünschten Stil, verwenden Sie geschickt Anregungen, und Sie erhalten ein sehr anständiges Ergebnis.

Deep AI

Ein primitives neuronales Netzwerk, das Bilder auf seltsame Weise generiert. Das Ergebnis ähnelt Collagen, die von Kindern im Kindergarten während einer Kreativitätsstunde erstellt wurden. Man kann darüber lachen und es wie einen schlechten Traum vergessen.

Fähigkeiten und Benutzerfreundlichkeit

Die Arbeit mit dem neuronalen Netzwerk ist einfach, aber um ein anständiges Ergebnis zu erzielen, sind titanische Anstrengungen erforderlich.

Bildqualität

Lassen Sie uns einfach die Anfrage „Generieren Sie für mich eine obdachlose Person, die neben einem Müllcontainer auf der Straße sitzt und einen Laptop hält. Eine rote Katze sitzt neben ihm, vor dem Hintergrund der Metropole“ ansehen.

Probleme sind nicht auf eine falsche Eingabe zurückzuführen. Wenn Sie sich die Galerie (nachts nicht empfohlen, für schwangere Frauen und Kinder) von Bildern auf der Website ansehen, können Sie sehen, dass alle Bilder gleichermaßen unsinnig sind.

Geschwindigkeit

Unmittelbare Generierung.

Kosten

Die kostenlose Version ermöglicht den Zugriff auf alle grundlegenden Funktionen des neuronalen Netzwerks. Spezifische Funktionen in PRO für 5 $ pro Monat sind unbekannt.

Vor- und Nachteile

Pros	Cons
Kann Spaß machen	Sehr niedrige Bildqualität
	Teilweise kostenpflichtig

Canva KI

Canva, ein führendes Werkzeug zur Erstellung von Kreativität in Design, Branding und anderen Branchen, hat das Canva KI-Tool veröffentlicht.

Funktionen und Benutzerfreundlichkeit

Jetzt ist in der PRO-Version neben anderen Tools ein Feld zur Eingabe eines Textprompt in der linken Seitenleiste der Website erschienen, wenn Sie eine Kreation erstellen. Canva AI versteht natürliche Sprache, daher ist es nicht notwendig, einen Prompt für ein gutes Ergebnis zu lernen.

Der Generator ist für einen Zweck konzipiert – um den Prozess der Erstellung von Designinhalten zu beschleunigen und zu verbessern, so dass er ausschließlich für diese Zwecke geeignet ist.

Bildqualität

Die Bildqualität entspricht möglicherweise nicht immer den Erwartungen, aber angesichts der kürzlichen Veröffentlichung von Canva AI ist dies verzeihlich. Unten sind Beispiele für Bilder, die von dieser KI generiert wurden.

Geschwindigkeit

Die Generierung erfolgt nahezu sofort.

Kosten

Canva AI ist in das PRO-Abonnement von Canva integriert.

Vor- und Nachteile

Vorteile	Nachteile
Gutes Werkzeug für Designer	Bezahlt
Einmonatige kostenlose Testversion verfügbar

NightCafe

NightCafe ist ein Tool mit sehr umfangreichen Möglichkeiten zur Bildgenerierung. Es kombiniert viele fortschrittliche neuronale Netzwerke und ermöglicht das Erstellen eigener Stile basierend auf ihnen.

Fähigkeiten und Benutzerfreundlichkeit

Es gibt eine bedeutende Gemeinschaft rund um NightCafe, was es einfach macht, interessante Fragen zu stellen, Hilfe bei Anregungen zu suchen usw. Das System des Generators fördert die Zusammengehörigkeit, indem zusätzliche Credits vergeben werden, wenn Bilder in der Gemeinschaft veröffentlicht werden.

NightCafe verfügt über eine sehr benutzerfreundliche Oberfläche und ein Generierungssystem, das auch für Anfänger geeignet ist.

Qualität der Bilder

Der Vergleich der Bildqualität mit fortschrittlichen neuronalen Netzwerken ist derzeit eine Herausforderung. Es wird jedoch davon ausgegangen, dass NightCafe bald mit seinen Konkurrenten gleichziehen und starke Konkurrenz bieten wird. Der Generator hat alles, was er braucht: eine zusammenhängende Community, ein einzigartiges Angebot mehrerer neuronaler Netzwerke innerhalb eines Projekts, ein System zur unabhängigen Erstellung von Stilen und die Möglichkeit, Anregungen auf der Website zu veröffentlichen, die von anderen genutzt werden können.

Auch jetzt kann man nicht sagen, dass alles schlecht ist. Aber um gute Ergebnisse zu erzielen, wird es auf jeden Fall notwendig sein, den Generator sorgfältig zu studieren und den effektivsten Interaktionsweg zu finden.

Das erste Bild wurde mit der Anregung „Erstellen Sie ein Bild im Stil von Van Goghs Gemälden mit einem Mädchen, das eine Sonnenbrille trägt“ erstellt.

Das Erstellen eines Bildes mit einer obdachlosen Person und einem Laptop stellte sich als viel schwieriger heraus. Wahrscheinlich hat KI immer noch Schwierigkeiten, natürliche Sprache zu verstehen, trotz gegenteiliger Behauptungen, daher die Schwierigkeiten. Wenn wir jedoch das Gesicht der Katze anstelle eines menschlichen Gesichts und ähnliche Fehler aufgrund von Promptungenauigkeiten übersehen, sieht die Arbeit mehr als zufriedenstellend aus.

Generierungsprompt unten: „eine obdachlose Person mit einem Laptop und einer roten Katze erstellen.“

Generationsaufforderung unten: „Erstellen Sie eine obdachlose Person, die neben einem Mülleimer auf der Straße sitzt und einen Laptop in der Hand hält. Eine rote Katze sitzt in der Nähe.“

Leistung

10-15 Sekunden.

Preisgestaltung

Eine kostenlose Version ist mit ihren Einschränkungen verfügbar. Die Anzahl der Verwendungen in der kostenlosen Version ist begrenzt, aber zusätzliche Guthaben (Bilder werden pro Guthaben generiert) können durch Veröffentlichung von Generationen in der Community und anderen Aktionen erhalten werden.

Vor- und Nachteile

Vorteile	Nachteile
Fähigkeit, Ihre Styles mit Benutzern zu erstellen und zu teilen	Erfordert die Eingabe eines genauen technischen Befehls, versteht natürliche Sprache schlecht
Umfassende Möglichkeiten mit mehreren neuronalen Netzwerkmodellen unter einer Oberfläche	Probleme beim Rendern von Gesichtern, Händen und kleinen Details
Möglichkeit zur kostenlosen Nutzung	Erfordert eine kostenpflichtige Version für volle Funktionalität

Bing Bild Ersteller

Microsoft hat seine Suchmaschine mit ChatGPT veröffentlicht und somit die Möglichkeit geschaffen, Bilder mit DALL-E zu generieren.

Fähigkeiten und Benutzerfreundlichkeit

Wir haben zuvor über DALL-E als Ersten in unserer Top-Liste geschrieben, und da Bing Bild Ersteller ein vollständiges Analogon dieses Generators ist, besteht keine Notwendigkeit, alles erneut zu beschreiben. Alle Informationen können oben gefunden werden.

Unten sind Bilder, die im Bing Bild Ersteller generiert wurden. Sie unterscheiden sich nicht von DALL-E.

Jasper Kunst

Jasper Kunst ist ein Produkt des gleichen Unternehmens, das Jasper Chat erstellt hat. Ersteres wird verwendet, wenn Anfragen in den Chat eingegeben werden, wie „erzeuge mir“, das heißt, wie DALL-E ist es vollständig in Jasper Chat integriert.

Fähigkeiten und Benutzerfreundlichkeit

Leider können wir nicht unabhängig untersuchen, wie Jasper Art funktioniert, da die kostenlose Version nur nach Eingabe von Zahlungsdetails verfügbar ist. In der Theorie sollte es gut auf einfache menschliche Sprache reagieren, aber Benutzer im Internet beschweren sich, dass das neuronale Netzwerk schlecht versteht, welches Bild eine Person davon erhalten möchte.

Bildqualität

Benutzer im Internet bemerken, dass die Bildqualität derzeit viel zu wünschen übrig lässt. Nach dem Jasper Chat zu urteilen, wird sich der Bildgenerator wahrscheinlich bald verbessern.

Leistung

Die Leistung ist unbekannt.

Preisgestaltung

Vor- und Nachteile

Pros	Cons
Eine Alternative zu ChatGPT mit DALL-E. Es entspricht derzeit nicht dem Niveau der Bildgenerierung, aber der Generator entwickelt sich ständig weiter.	Das neuronale Netzwerk versteht nicht, was von ihm erwartet wird.
Kostenlose Testversion für eine Woche.	Erfordert Zahlung.

Starry AI

Beim Betreten der Website und der Registrierung werden uns vier Optionen für die Generierung präsentiert: Zeichnungen, Fotos, Illustrationen und das Erstellen des eigenen Stils. Insgesamt hat das neuronale Netzwerk eine minimalistische und sehr benutzerfreundliche Benutzeroberfläche.

Fähigkeiten und Benutzerfreundlichkeit

Das neuronale Netzwerk bevorzugt präzise technische Anweisungen anstelle von natürlicher menschlicher Sprache, daher ist es herausfordernd, normal mit ihm zu kommunizieren. Alle typischen Probleme mit neuronalen Netzwerken sind erkennbar: zehn Finger, sich wiederholende Elemente und seltsame Augen und Gesichter.

Auf die Anfrage „Generiere eine obdachlose Person mit einem Laptop und einer roten Katze für mich“ haben wir dies erhalten:

Interessanterweise hält die Person einen Apple-Laptop und schwebt. Aber ein faszinierender Moment: Es gab keine Probleme mit der Haarfarbe, die zur Katze passte, oder damit, ein Katzengesicht anstelle eines menschlichen Gesichts zu generieren. In einigen Variationen verschwand die Katze jedoch ganz.

Bildqualität

Sehr wahrscheinlich können Sie bei tieferem Eintauchen in den Generator gute Ergebnisse erzielen. Sie können jedoch nur bis zu zwei Bilder pro Tag erstellen, oder Sie müssen ein PRO-Konto kaufen.

Bei einer einfacheren Anfrage wie „Generieren Sie ein Bild im Stil von Van Goghs Gemälden mit einem Mädchen in Sonnenbrillen“ haben wir dieses Bild erhalten:

Leistung

Starry AI generiert Bilder langsamer als andere Generatoren – etwa 30 Sekunden. Die Computer-Version hinkt in allen Arbeitsphasen deutlich hinterher: Probleme bei der Registrierung, beim Start des Prozesses und beim Herunterladen fertiger Bilder.

Preisgestaltung

Das PRO-Konto kostet 9 Dollar pro Monat. Eine mobile Anwendung ist für alle Geräte verfügbar.

Vor- und Nachteile

Vorteile	Nachteile
Entwicklung, anständige Qualität der Generationen	Arbeitet langsam
Bequeme minimalistische Benutzeroberfläche	Erfordert Zahlung

Dream Studio (Stable Diffusion)

Dream Studio ist eine Benutzeroberfläche zur Verwendung des neuronalen Netzwerks für die Bildgenerierung Stable Diffusion.

Fähigkeiten und Benutzerfreundlichkeit

Wenn Stable Diffusion ein „schweres“ neuronales Netzwerk ist, das nur auf einem leistungsstarken Computer installiert werden kann, ermöglicht es Dream Studio, den Generator direkt auf seiner minimalistischen und benutzerfreundlichen Website mit Stil-Einstellungen, Bildformatoptionen und mehr zu verwenden.

Bildqualität

Wir konnten die Bildqualität aufgrund der Schwierigkeit, auf dieses neuronale Netzwerk zuzugreifen, nicht manuell überprüfen. Da es sich um eine Benutzeroberfläche handelt und sich im Testmodus befindet, können ähnliche Schwierigkeiten auftreten. Die Galerie der generierten Bilder sieht jedoch beeindruckend aus.

Betriebsgeschwindigkeit

Unbekannt.

Kosten

Zunächst hat der Benutzer Zugang zu hundert Credits – etwa 500 kostenlose Generationen. Diese Menge reicht aus, um die Fähigkeiten der Website vollständig zu erkunden und zu entscheiden, ob Credits gekauft werden sollen. 1000 Credits kosten nur 10 Dollar.

Vor- und Nachteile

Pro	Contra
Gute Bildqualität	Registrierungsprobleme
Benutzerfreundliche Oberfläche	Teilweise kostenpflichtig

Fazit

In der Welt gibt es einen ethischen Kampf zwischen Inhaltserstellern und KI, und Unternehmen führen ständig neue Regeln für die Verwendung künstlicher Intelligenz in ihrer Arbeit ein (insbesondere im Hinblick auf Wettbewerbsbeiträge, preisgekrönte Werke usw.). Es ist unbekannt, wie dieser ethische Krieg enden wird, aber die Fähigkeit, Generatoren geschickt und nachdenklich einzusetzen, ist eine nützliche Fähigkeit, die bald für jeden relevanten Job erforderlich sein wird. Der Schlüssel ist nicht, mechanisch Bilder zu erstellen und sie als Kunst auszugeben, sondern KI als Werkzeug zu verwenden, um die Effizienz einer lebenden Person zu steigern.