Digital Life
Ob ein Algorithmus kreativ werden kann? Diese Bildautomatik basiert auf KI
Vielleicht klingt es nach Spielerei, denn wozu braucht es Kreativität bei einer künstlichen Intelligenz (KI)? Tatsächlich könnte ein kreativer Algorithmus aber beim Generieren optimaler Bilder unterstützen. So eine Bildautomatik, die auf KI basiert, haben Wissenschaftler nun entwickelt.
Eine auf KI basierende Bildautomatik könnte zukünftig vielleicht in der Werbung Anwendung finden. Doch wie sehen ihre Ergebnisse genau aus und haben KIs wirklich künstlerische Fähigkeiten, wie sie bislang nur von Menschen bekannt sind? Das findest Du jetzt heraus.
Bilder auf Zuruf: Diese KI generiert Bilder anhand der Beschreibung
Am Projekt Retrieve GAN arbeiten Forscher von Google, der Universität Kalifornien (Merced) und der Yonsei University zusammen, um eine KI zu entwickeln, die Bilder und Bildwelten einfach auf Grundlage einer Beschreibung malen kann.
Du wünschst Dir zum Beispiel ein Bild von zwei Booten im Wasser, rechts im Bild eine Brücke, im Hintergrund Wolkenkratzer und passend dazu einen bewölkten Himmel? Solche Motive kann die KI von Retrieve GAN bereits gut umsetzen. Allerdings steht kein Roboterarm vor einer Staffelei und pinselt fleißig drauf los. Stattdessen läuft die auf KI basierende Bildautomatik jedes Mal in drei Schritten ab:
- Verstehen der Beschreibung
Nur wenn Retrieve GAN tatsächlich weiß, was das neue Bild enthalten soll, kann die KI auch mit der Arbeit beginnen. Aktuell bekommt das System dazu einen sogenannten Szenengraphen, der alle relevanten Infos enthält. - Finden passender Bestandteile
Als nächstes sucht die KI nach den passenden Bestandteilen für das Werk. Die Boote nimmt sie aus dem einen Bild, das Wasser aus einem anderen, dazu findet sie noch eine passende Brücke, Wolkenkratzer und einen bewölkten Himmel. Schon ist alles beisammen. - Generierung des Bildes
Im letzten Schritt, wenn alle Bildausschnitte bereitliegen, setzt Retrieve GAN alles passgenau zusammen. Das Bild ist fertig und kann begutachtet werden.
Weitere künstliche Intelligenz lernt menschliche Kunst
Bereits im Jahr 2018 hat eine andere KI den Weg in die Kreativwirtschaft gefunden, nämlich als Karikaturist. Die Kunst des karikaturistischen Zeichnens besteht bekanntlich darin, das perfekte Gleichgewicht aus Abstraktion und Realismus zu finden. Schließlich soll eine Karikatur – so verzerrt sie auch sein mag – einen hohen Wiedererkennungswert zu einer realen Person ermöglichen. Dazu verändern Künstler meist die Proportionen der gezeichneten Person, achten dabei vor allem auf Details und bewahren gleichzeitig einen ganz individuellen Zeichenstil.
So gesehen erfordert eine gelungene Karikatur also besonders viel menschlichen Einfluss. Entwicklern von Microsoft und der City University of Hong Kong ist es gelungen, diese besondere Ausdruckskunst mit einer künstlichen Intelligenz nachzustellen.
Dabei handelt es sich auch heute noch um eine bemerkenswerte Leistung, da für Karikaturen keine klaren Regeln definiert werden können. Daher kombinierten die Forscher riesige Datenmengen, die aus tausenden Karikaturen verschiedenster Künstler stammten, mit Hilfe von maschinellem Lernen.
GAN: Zwei KIs sind besser als eine
Bei der Durchführung wandten die Forscher beider Projekte sogenannte Generative Adversarial Networks (GAN) an, was so viel wie erzeugende, gegnerische Netzwerke bedeutet. Diese stellen in der Informatik eine gängige Methode dar, um maschinelles Lernen zu ermöglichen. Dabei müssen die KIs zweier Netzwerke miteinander arbeiten.
Und so funktioniert’s: Das erste Netzwerk erarbeitet verschiedene Lösungen, die sich im gewünschten Ergebnisbereich befinden. Währenddessen gleicht das zweite Netzwerk diese Ergebnisse mit den gewünschten Resultaten anhand von Vorlagen ab und nimmt so lange Korrekturen vor, bis die gewünschten Ergebnisse umgesetzt sind.
KI-Teamarbeit führt zum gewünschten Ergebnis
Dieses Prinzip wurde auch auf das Karikatur-Zeichnen übertragen: Während die KI des einen Netzwerks Porträts bekannter Menschen nur durch die Veränderungen ihrer Proportionen abwandelte, übertrug die KI des zweiten Netzwerks typische Zeichenstile der vorgegebenen Karikaturen auf die künstlich erstellte Abbildung des ersten Netzwerks.
Zusammengesetzt ergaben die angefertigten Ergebnisse eine vollwertige Karikatur, wie sie auch ein menschlicher Künstler angefertigt haben könnte.
Der Knackpunkt dabei war allerdings, dass die beiden KIs alleine nicht zu diesem Resultat gekommen wären, da jedes Ergebnis für sich allein viel zu abstrakt ausfiel, um den karikierten Personen zugeordnet werden zu können.
Wie sehen die Ergebnisse der auf KI basierenden Bildautomatiken aus?
Ob Karikatur oder neu gemaltes Bild auf Zuruf: Wenn sich KIs nicht nur künstlich, sondern auch künstlerisch betätigen, dann sind die Ergebnisse natürlich das Spannendste.
Um die Karikaturen der KI der Entwickler von Microsoft und der City University of Hong Kong bestaunen zu können, brauchst Du bloß einen Blick in ihre Forschungsarbeit zu werfen. Dort kannst Du nämlich gleich zu Anfang schon sehen, wie die Karikaturen entstanden sind – vom ursprünglichen Foto bis zur fertigen KI-generierten Karikatur.
Noch mehr zusammengesetzte Bilder, die Retrieve GAN bisher generiert hat, findest Du in der Veröffentlichung der Forscher. Du kannst anhand von zahlreichen Beispielen nachvollziehen, wie die auf KI basierende Bildautomatik arbeitet und zu ihren Ergebnissen kommt. Die sind zwar aktuell noch nicht für den professionellen Einsatz tauglich, aber ein wichtiges Zwischenziel haben die Wissenschaftler damit schon erreicht. Denn die KI kann den Zusammenhang zwischen den einzelnen Bildbestandteilen erkennen und sucht deshalb wesentlich cleverer nach passenden Ausschnitten.
Die Forschung auf diesem Gebiet soll selbstverständlich weitergehen, sodass auf KI basierende Bildautomatiken in Zukunft noch viel intelligenter arbeiten und professionelle Ergebnisse liefern dürften.
Künstliche Intelligenzen als kreative Künstler – kommt die Maschine an den Menschen ran? Wie lautet Deine Meinung zu diesem Thema? Lass es uns in den Kommentaren wissen.