Fachartikel
KI-generierte Bilder im Test: Sind sie wirklich realistisch?
Haben Sie schon einmal ein Bild gesehen, das so realistisch wirkte, dass Sie sich fragten, ob es tatsächlich von einer Kamera aufgenommen wurde?
Die rasante Entwicklung der Künstlichen Intelligenz macht es möglich, fotorealistische KI-Bilder am Computer zu erzeugen. Aber wie gut können diese KI-generierten Bilder mit echten Fotos mithalten?
Wir haben uns diese Frage gestellt und einen spannenden Vergleich durchgeführt. Sie können selbst knobeln, denn erst am Ende dieses Artikels verraten wir Ihnen, welche Bilder KI-generiert und welche Originalbilder sind.
Wie entstehen KI-generierte Bilder?
KI-generierte Bilder sind das Ergebnis komplexer Algorithmen, die in der Lage sind, die Essenz von Millionen von Bildern zu erfassen und daraus völlig neue visuelle Kreationen zu schaffen. Stellen Sie sich vor, ein KI-Modell wird mit einer riesigen Bibliothek von Bildern gefüttert – von Landschaften und Porträts bis hin zu abstrakten Kunstwerken. Durch maschinelles Lernen erkennt das Modell wiederkehrende Muster, Farben, Stile und Kompositionselemente.
Wenn wir die KI beispielsweise bitten, ein Bild von einem Hund am Strand zu erstellen, durchsucht das Modell seine Datenbank nach relevanten Informationen: Bilder von Hunden, Bilder von Stränden, Farben, die typischerweise mit diesen Szenen assoziiert werden, und so weiter. Diese Elemente werden dann zu einem kohärenten und visuell ansprechenden Bild zusammengesetzt.
Um es einfach auszudrücken: KI-generierte Bilder sind wie eine Art Super-Collage, bei der ein Computer Tausende von Bildern mischt und kombiniert, um etwas völlig Neues zu erschaffen
KI-generierte Bilder mit Fotos im Vergleich: Was kann die KI wirklich?
Wir wollten es wissen: Eignen sich KI-generierte Bilder im Unternehmenskontext? Als KI-Generator haben wir Firefly von Adobe eingesetzt. Firefly zeichnet sich durch seine intuitive Bedienung und die hohe Qualität der generierten Bilder aus. Besonders praktisch ist die Möglichkeit, eigene Referenzbilder hochzuladen. So kann der Nutzer die KI gezielt anleiten und sicherstellen, dass die Ergebnisse seinen Vorstellungen entsprechen.
Wir wählten drei alltägliche Szenarien aus unserem Unternehmensleben: ein gemütliches Frühstück, unseren liebsten vierbeinigen Kollegen und eine lebhafte Firmenfeier. Für jedes Szenario wählten wir ein aussagekräftiges Referenzbild aus unserem Fundus. Anschließend haben wir Firefly detaillierte Beschreibungen dieser Bilder als Textprompt mitgegeben. Das Besondere dabei: Wir ließen Firefly sowohl ohne als auch mit dem jeweiligen Referenzbild arbeiten. Ziel war es herauszufinden, inwieweit die Referenzbilder die KI bei der Erstellung realistischer und detailgetreuer KI-generierter Bilder unterstützen.
Welches Bild ist echt und welches wurde von KI generiert?
Die Auflösung gibt es unten.
Bildvergleich 1: Unser LMIS-internes Frühstück
Jeden Mittwoch findet unser internes Frühstück statt. Wir wollten herausfinden, wie gut die KI mit Gegenständen umgehen kann. Dazu eignet sich unser Frühstück sehr gut, dachten wir. Den Prompt, also den Befehl, den wir der KI für die generierten Bilder gegeben haben, haben wir auf Basis des Originalfotos erstellt. Dabei haben wir versucht, so genau wie möglich zu beschreiben, was zu sehen ist. Der Prompt lautete:
A close-up of a hand reaching toward a selection of sliced cheese, meat and dips on a silver platter. The platter is set out on a white table. In the background, a wicker basket filled with various types of bread can be seen. An office break room.
Bildvergleich 2: Bürohund Topsi
In unserem zweiten Versuch der KI-generierten Bilder wollten wir sehen, wie die KI mit Tieren umgeht. Dazu haben wir ein Foto von Topsi ausgewählt. Topsi ist der Hund von agile Coach Ann-Chrisitn, die ihn regelmäßig mit ins Büro bringt. Kleiner Disclaimer an dieser Stelle: Bei unseren Experimenten ist kein Tier zu Schaden gekommen. Der Prompt lautete:
A stretching dog with his behind upwards that is white and black with a white snout, ears and the area around his eyes are black, wooden floor in a dark brown color, white walls, some furniture and a green plant stand in front of the back wall.
Bildvergleich 3: Yash und Daniel auf dem Sommerfest
In unserem dritten Versuch stellten wir die KI vor den ultimativen Test: Wir wollten sehen, wie sie mit Bildern von Menschen umgeht. Dafür haben wir uns ein Foto unseres letzten Sommerfestes ausgesucht. Hier sind unsere Mitarbeiter Yash und Daniel zu sehen, die das Cocktail-Angebot genießen. Der Prompt für die KI-generierten Bilder war diesmal ein bisschen weniger detailliert und lautete:
A photo of two guys, one european, tall and blond, one indian with glasses, less tall, sipping on a straw with cocktails in their hands surrounded by other people at an office party in Germany looking straight into the camera.
KI-generierte Bilder im Unternehmen
Die Nachfrage nach qualitativ hochwertigen visuellen Inhalten steigt ständig. KI-generierte Bilder bieten eine effiziente und kostengünstige Lösung. Durch die Automatisierung vieler Designprozesse entfallen zeitaufwändige manuelle Arbeiten. Auch abstrakte Konzepte lassen sich mit KI leicht visualisieren, was zu einem besseren Verständnis führt. Unternehmen können Ressourcen bündeln und sich auf strategische Aufgaben konzentrieren. Gleichzeitig wird die Kreativität durch KI-generierte Bilder gefördert, denn KI-Tools eröffnen neue Perspektiven und ermöglichen die Entwicklung innovativer Designs. Man merkt an unserem Beispiel aber auch, dass in bestimmten Details noch unrealistische Elemente auftreten können, die die Glaubwürdigkeit der Bilder beeinträchtigen.
Leider können diese großartigen neuen Anwendungen der KI auch schnell ausgenutzt werden. Die Erstellung täuschend echter, aber gefälschter KI-generierter Bilder kann zu Missbrauch und Manipulation führen. Auch die Frage der Urheberrechte an KI-generierten Inhalten ist noch nicht abschließend geklärt. Unternehmen sollten sich daher bewusst sein, dass der Einsatz von KI-generierten Bildern auch Risiken birgt und entsprechende Vorkehrungen treffen, um rechtliche und ethische Fallstricke zu vermeiden. Dazu gehört auch ein Bewusstsein für die wachsende Bedeutung von Cyber Security, um die Integrität der eigenen digitalen Assets zu schützen. Als Spezialist für den Einsatz und die Implementierung von KI-Lösungen in Unternehmen wissen wir, worauf es ankommt.
Auflösung: KI-generierte Bilder im Unternehmen
Bildvergleich 1: Unser LMIS-internes Frühstück
In diesem Fall hat die KI wirklich gute Arbeit geleistet. Auch wenn die Hand und der Arm auf dem Bild ohne Referenz etwas zu weichgezeichnet sind, sehen die KI-generierten Bilder doch realistisch aus. Auf dem Bild mit Referenz stimmt sogar die Perspektive, aus der das Bild aufgenommen wurde.
Bildvergleich 2: Bürohund Topsi
Hier zeigt sich, dass die KI ohne Referenz bei KI-generierten Bildern an ihre Grenzen stößt. Während das Bild mit dem Original als Vorlage ein recht getreues Abbild dessen ist, was wir vorgegeben haben, ist das Bild ohne Referenz sehr unrealistisch. Der Hund ist unproportioniert, sein Körper ist zu lang und es sieht eher so aus, als hätte man einen sich streckenden Hund an einen liegenden Hund angehängt. Mit Referenzbild sieht das KI-Bild dem Original jedoch sehr ähnlich. Die Farbe von Topsis Fell wurde leicht verändert, und sein Fell ist vor allem an den Vorderbeinen länger. Auch der Hintergrund wurde leicht verändert. Auf jeden Fall ein sehr realistisches Ergebnis.
Bildvergleich 3: Yash und Daniel auf dem Sommerfest
Die KI-Anwendung Firefly von Adobe ist hier anderen Tools deutlich überlegen. Bereiche, mit denen Programme sonst oft Schwierigkeiten haben, wie die Augen oder die Mundpartie, sind hier gut und realistisch umgesetzt – zumindest bei den beiden Menschen im Fokus. Wenn man genau hinschaut, sieht man auf dem Bild ohne Referenz rechts im Hintergrund eine Person, die kein wirkliches Gesicht hat. Beide KI-generierten Bilder kommen damit durcheinander, welche Person eine Brille tragen soll. Ansonsten ist das Referenzbild dem anderen KI-generierten Bild überlegen. Die Stimmung entspricht viel mehr dem Original und auch die Anweisungen bezüglich der beiden Personen wurden umgesetzt.