Team brainstormt über die Bilderauswahl
© iStock
Podolski hält einen Fußball in die Kamera mit Vodafone Logo für die Baller League
Auf dem Bild vom DAZN Unlimited-Artikel sind die Fußballstars Erling Haaland, Harry Kane, Kylian Mbappé und Florian Wirtz abgebildet. Von links nach rechts trägt Haaland das hellblaue Trikot von Manchester City, Kane das rote Trikot des FC Bayern München, Mbappé das weiße Trikot von Real Madrid und Wirtz das rote Trikot von Bayer Leverkusen. Die Spieler sind in dynamischen Posen dargestellt, vor einem hellen, himmlischen Hintergrund mit einem angedeuteten Stadion. Unten im Bild befinden sich die Logos von DAZN und der UEFA Champions League.

Ob ein Algorithmus kreativ werden kann? Diese Bildautomatik basiert auf KI

Vielle­icht klingt es nach Spiel­erei, denn wozu braucht es Kreativ­ität bei ein­er kün­stlichen Intel­li­genz (KI)? Tat­säch­lich kön­nte ein kreativ­er Algo­rith­mus aber beim Gener­ieren opti­maler Bilder unter­stützen. So eine Bil­dau­tomatik, die auf KI basiert, haben Wis­senschaftler nun entwickelt.

Eine auf KI basierende Bil­dau­tomatik kön­nte zukün­ftig vielle­icht in der Wer­bung Anwen­dung find­en. Doch wie sehen ihre Ergeb­nisse genau aus und haben KIs wirk­lich kün­st­lerische Fähigkeit­en, wie sie bis­lang nur von Men­schen bekan­nt sind? Das find­est Du jet­zt heraus.

Bilder auf Zuruf: Diese KI generiert Bilder anhand der Beschreibung

Am Pro­jekt Retrieve GAN arbeit­en Forsch­er von Google, der Uni­ver­sität Kali­fornien (Merced) und der Yon­sei Uni­ver­si­ty zusam­men, um eine KI zu entwick­eln, die Bilder und Bild­wel­ten ein­fach auf Grund­lage ein­er Beschrei­bung malen kann.

Du wün­schst Dir zum Beispiel ein Bild von zwei Booten im Wass­er, rechts im Bild eine Brücke, im Hin­ter­grund Wolkenkratzer und passend dazu einen bewölk­ten Him­mel? Solche Motive kann die KI von Retrieve GAN bere­its gut umset­zen. Allerd­ings ste­ht kein Robot­er­arm vor ein­er Staffelei und pin­selt fleißig drauf los. Stattdessen läuft die auf KI basierende Bil­dau­tomatik jedes Mal in drei Schrit­ten ab:

  1. Ver­ste­hen der Beschreibung
    Nur wenn Retrieve GAN tat­säch­lich weiß, was das neue Bild enthal­ten soll, kann die KI auch mit der Arbeit begin­nen. Aktuell bekommt das Sys­tem dazu einen soge­nan­nten Szenen­graphen, der alle rel­e­van­ten Infos enthält.
  2. Find­en passender Bestandteile
    Als näch­stes sucht die KI nach den passenden Bestandteilen für das Werk. Die Boote nimmt sie aus dem einen Bild, das Wass­er aus einem anderen, dazu find­et sie noch eine passende Brücke, Wolkenkratzer und einen bewölk­ten Him­mel. Schon ist alles beisammen.
  3. Gener­ierung des Bildes
    Im let­zten Schritt, wenn alle Bil­dauss­chnitte bere­itliegen, set­zt Retrieve GAN alles pass­ge­nau zusam­men. Das Bild ist fer­tig und kann begutachtet werden.
Bitte akzeptieren Sie die Nutzung von Drittanbieter-Einbindungen mit einem Klick auf den folgenden Button:

Weitere künstliche Intelligenz lernt menschliche Kunst

Bere­its im Jahr 2018 hat eine andere KI den Weg in die Kreativwirtschaft gefun­den, näm­lich als Karika­tur­ist. Die Kun­st des karika­tur­is­tis­chen Zeich­nens beste­ht bekan­ntlich darin, das per­fek­te Gle­ichgewicht aus Abstrak­tion und Real­is­mus zu find­en. Schließlich soll eine Karikatur – so verz­er­rt sie auch sein mag – einen hohen Wieder­erken­nungswert zu ein­er realen Per­son ermöglichen. Dazu verän­dern Kün­stler meist die Pro­por­tio­nen der geze­ich­neten Per­son, acht­en dabei vor allem auf Details und bewahren gle­ichzeit­ig einen ganz indi­vidu­ellen Zeichenstil.

So gese­hen erfordert eine gelun­gene Karikatur also beson­ders viel men­schlichen Ein­fluss. Entwick­lern von Microsoft und der City Uni­ver­si­ty of Hong Kong ist es gelun­gen, diese beson­dere Aus­druck­skun­st mit ein­er kün­stlichen Intel­li­genz nachzustellen.

Dabei han­delt es sich auch heute noch um eine bemerkenswerte Leis­tung, da für Karika­turen keine klaren Regeln definiert wer­den kön­nen. Daher kom­binierten die Forsch­er riesige Daten­men­gen, die aus tausenden Karika­turen ver­schieden­ster Kün­stler stammten, mit Hil­fe von maschinellem Lernen.

GAN: Zwei KIs sind besser als eine

Bei der Durch­führung wandten die Forsch­er bei­der Pro­jek­te soge­nan­nte Gen­er­a­tive Adver­sar­i­al Net­works (GAN) an, was so viel wie erzeu­gende, geg­ner­ische Net­zw­erke bedeutet. Diese stellen in der Infor­matik eine gängige Meth­ode dar, um maschinelles Ler­nen zu ermöglichen. Dabei müssen die KIs zweier Net­zw­erke miteinan­der arbeiten.

Und so funktioniert’s: Das erste Net­zw­erk erar­beit­et ver­schiedene Lösun­gen, die sich im gewün­scht­en Ergeb­nis­bere­ich befind­en. Während­dessen gle­icht das zweite Net­zw­erk diese Ergeb­nisse mit den gewün­scht­en Resul­tat­en anhand von Vor­la­gen ab und nimmt so lange Kor­rek­turen vor, bis die gewün­scht­en Ergeb­nisse umge­set­zt sind.

KI-Teamarbeit führt zum gewünschten Ergebnis

Dieses Prinzip wurde auch auf das Karikatur-Zeich­nen über­tra­gen: Während die KI des einen Net­zw­erks Porträts bekan­nter Men­schen nur durch die Verän­derun­gen ihrer Pro­por­tio­nen abwan­delte, übertrug die KI des zweit­en Net­zw­erks typ­is­che Zeichen­stile der vorgegebe­nen Karika­turen auf die kün­stlich erstellte Abbil­dung des ersten Netzwerks.

Zusam­menge­set­zt ergaben die ange­fer­tigten Ergeb­nisse eine voll­w­er­tige Karikatur, wie sie auch ein men­schlich­er Kün­stler ange­fer­tigt haben könnte.

Der Knack­punkt dabei war allerd­ings, dass die bei­den KIs alleine nicht zu diesem Resul­tat gekom­men wären, da jedes Ergeb­nis für sich allein viel zu abstrakt aus­fiel, um den karikierten Per­so­n­en zuge­ord­net wer­den zu können.

Wie sehen die Ergebnisse der auf KI basierenden Bildautomatiken aus?

Ob Karikatur oder neu gemaltes Bild auf Zuruf: Wenn sich KIs nicht nur kün­stlich, son­dern auch kün­st­lerisch betäti­gen, dann sind die Ergeb­nisse natür­lich das Spannendste.

Um die Karika­turen der KI der Entwick­ler von Microsoft und der City Uni­ver­si­ty of Hong Kong bestaunen zu kön­nen, brauchst Du bloß einen Blick in ihre Forschungsar­beit zu wer­fen. Dort kannst Du näm­lich gle­ich zu Anfang schon sehen, wie die Karika­turen ent­standen sind – vom ursprünglichen Foto bis zur fer­ti­gen KI-gener­ierten Karikatur.

Noch mehr zusam­menge­set­zte Bilder, die Retrieve GAN bish­er gener­iert hat, find­est Du in der Veröf­fentlichung der Forsch­er. Du kannst anhand von zahlre­ichen Beispie­len nachvol­lziehen, wie die auf KI basierende Bil­dau­tomatik arbeit­et und zu ihren Ergeb­nis­sen kommt. Die sind zwar aktuell noch nicht für den pro­fes­sionellen Ein­satz tauglich, aber ein wichtiges Zwis­chen­ziel haben die Wis­senschaftler damit schon erre­icht. Denn die KI kann den Zusam­men­hang zwis­chen den einzel­nen Bildbe­standteilen erken­nen und sucht deshalb wesentlich clev­er­er nach passenden Ausschnitten.

Die Forschung auf diesem Gebi­et soll selb­stver­ständlich weit­erge­hen, sodass auf KI basierende Bil­dau­tomatiken in Zukun­ft noch viel intel­li­gen­ter arbeit­en und pro­fes­sionelle Ergeb­nisse liefern dürften.

Kün­stliche Intel­li­gen­zen als kreative Kün­stler – kommt die Mas­chine an den Men­schen ran? Wie lautet Deine Mei­n­ung zu diesem The­ma? Lass es uns in den Kom­mentaren wissen.

Das könnte Dich auch interessieren