Als Auftakt für eine dreiteilige Reihe schreibt Autorin Adriana über die Verknüpfung zwischen KI und Kunst. Sind künstliche Intelligenzen die Kunstschaffenden der Zukunft? Was bedeutet das für unsere zukünftige Wahrnehmung von Kunst und Kreativität?

Dass Computer besser rechnen können als wir, daran haben wir uns längst gewöhnt und dass sie in naher Zukunft vielleicht sogar sicherer Autofahren können, feiern wir als Fortschritt, aber wie sieht es mit der Kunst aus? Kann ein Roboter ein Meisterwerk auf die Leinwand bringen? Die Antwort lautet ja!

“The Next Rembrandt” von ING Group, 2016

Dieses Bild wurde nicht vom weltbekannten Portraitkünstler Rembrandt im 17. Jahrhundert gezeichnet, sondern von einer KI im Jahr 2016. Für das Projekt „The Next Rembrandt“ wurde mit Hilfe einer KI ein neues Porträt im Stil des holländischen Meisters und mittels eines 3-D-Druckers auf die Leinwand aufgetragen. Das Ergebnis ist so täuschend echt, dass selbst Kunsthistoriker:innen es für ein neu aufgetauchtes Original halten könnten. Aber steckt nicht in jedem noch so primitiven Kunstwerk etwas zutiefst Menschliches? Emotion, Leidenschaft, Kreativität? Sind wir wirklich so berechenbar?

Um unser gekränktes Ego nun zu beruhigen, könnte man argumentieren, dass dieses Gemälde kein Produkt echter Kreativität ist, sondern lediglich eine Nachahmung eines künstlerischen Prozesses. Andererseits lernen angehende Künstler:innen nicht auch, indem sie zunächst versuchen, Kunstwerke erfahrenerer Küstler:innen zu imitieren? Gibt es so etwas wie Kreativität also überhaupt, oder ist sie nur eine Illusion und ein weiteres Produkt der menschlichen Selbstüberschätzung? Diese Frage gehört zu den Fragen, die man nicht einfach ohne weiteres mit ja oder nein beantworten kann. Sagen wir einfach: wir wissen es (noch) nicht. Aber statt in der Vergangenheit zu schwelgen und zu versuchen, Künstler:innen aus längst vergangener Zeit wieder zum Leben zu erwecken, wäre es doch viel interessanter, den Blick in die Zukunft zu richten und zu erforschen, wozu KI noch in der Lage sein wird und was wir von ihr lernen können.

Hierfür lohnt es sich zunächst einen Blick in die Natur zu werfen. Genau genommen sind Tiere, darunter vor allem Insekten, die ältesten Kunstschaffenden unserer Welt. Das erkannte auch der argentinische Künstler Tomás Saraceno. Als er als Kind auf dem verstaubten Dachboden seines Elternhauses Spinnen dabei beobachtete, wie sie ihre Netze sponnen, wurde ihm zum ersten Mal ihr enormes künstlerisches Talent bewusst. Seit diesem Zeitpunkt erforscht Saraceno die Skulpturen der kleinen achtbeinigen Künstler, welche er nach über einem Jahrzehnt der Forschung immer noch nicht völlig begreift. Wenn man ein Spinnennetz einmal genauer betrachtet, fällt auf, wie komplex und raffiniert alle Fäden miteinander verbunden sind. So etwas würde ein Mensch niemals hinkriegen. Viele Astrophysiker vergleichen das Spinnennetz daher auch mit dem Netz des Universums. Sie erkennen in den Spinnennetzen tatsächlich Ähnlichkeiten dazu, wie sich Galaxien als lange Fäden im All ausbreiten.

Doch wie kann etwas, das uns so nah ist und von uns einfach weggefegt wird, ganze Galaxien beinhalten? Und was kann uns diese Tatsache darüber sagen, wie wir auf der Erde in die Milchstraße eingebettet sind? Saraceno versucht, dem verschlungenen Geheimnis unserer Existenz auf die Spur zu kommen. Dazu entwickelt er zusammen mit seinem Team aus Wissenschaftler:innen einen Scanner für Spinnennetze, von dem sogar das MIT (Massachusetts Institute of Technology) begeistert ist. Ist das noch Kunst oder längst Wissenschaft? Saraceno geht es genau darum, die Komfortzone der Kunst zu verlassen und darüber nachzudenken, was Kunst und Wissenschaft gemeinsam haben, welche neuen Wissensformen aus dieser ungewöhnlichen Symbiose entstehen können und was diese Welt wirklich braucht.

Was die Welt braucht, zeigt er uns in seiner spektakulären Netzinstallation mit dem Titel “Algo-r(h)i(y)thms”, welche innerhalb der Ausstellung „On Air“ 2018 im Palais de Tokyo in Paris in Kollaboration mit der NASA und anderen renommierten Instituten auf der ganzen Welt entstand. Seine Diagnose für unsere Gesellschaft lautet: Wir sehen zu viel! Der Mensch tendiert dazu, alles mit seinem Sehsinn erfassen zu wollen, doch wir sollten mehr wie Spinnen sein und auf die verschiedenen Vibrationen achten, die Dinge in die Umwelt aussenden. Um also zu erforschen, wie wir Menschen mehr von unserer Umwelt wahrnehmen können, nimmt Saraceno den Klang von Spinnen im Netz auf.

Tomás Saraceno, Algo-r(h)i(y)thms, 2018, Installation view at ON AIR, Palais de Tokyo, Paris, (Photo: Andrea Rosetti).

Spinnen haben sehr schlechte Augen und keine Ohren. Sie nehmen die Welt fast gänzlich über ihre Netze wahr und das machen sie unglaublich gut. Wo fängt also die Spinne an und wo hört sie auf? Ihr Netz stellt eine Erweiterung ihres Körpers dar. In seiner Installation schlüpfen die Betrachter:innen in die Rolle der Spinne und kommuniziert durch Vibration. Wie die Netze von Riesenspinnen spannen sich schwarze Schnüre in verschiedenartigen Verknotungen durch den weißen Raum. Sie kleben jedoch nicht. Berührt man aber eine der Schnüre, die über Tonabnehmer mit einem Computer verbundenen sind, erklingt ein echoartiger Ton. Jeder String erzeugt dabei einen anderen Sound. So entsteht ein in sich versponnener Ambient-Raum, der sich aus den Tönen immer wieder neu und anders zusammensetzt. Es handelt sich um 18 verschiedene Soundskulpturen, die in verschiedenen Frequenzen schwingen.  Eine davon handelt zum Beispiel vom typischen “Paarungsschauder” der australischen Spinnenart Argiope Keyserlingi.

Natürlich wissen wir längst, dass wir eingewoben in ein großes Ganzes sind, aber Tomás Saraceno lässt uns spüren, was das bedeutet: Spinnen, Synapsen, das Internet. Alles Netzwerke mit Knotenpunkten. So weist uns der argentinische Künstler vielleicht einen Weg in die Zukunft. Seine Kunstwerke werfen dabei die Frage danach auf, was wäre, wenn wir irgendwann ganz anders kommunizieren könnten? Vielleicht mittels Vibration oder vielleicht ganz ohne Interface mittels Bilder direkt aus dem Gehirn? Telepathie also.

Wie diese Gehirnbilder aussehen könnten, demonstriert der französische Künstler Pierre Huyghe. In seiner Ausstellung „UUmwelt“ von 2018 in der Serpentine Gallery in London stellt Huyghe Videos aus, die zeigen, inwiefern sich künstliche Intelligenz auf die Bilderzeugung und Bildverarbeitung auswirkt. In Zusammenarbeit mit dem japanischen Neurowissenschaftler Yukiasu Kamitani untersuchte er, ob es möglich ist, Maschinen so zu trainieren, dass sie unsere Gedanken und Träume durch MRT-Scans sichtbar machen können.

Pierre Huyghe, UUmwelt, Installation view, Serpentine Gallery, London, 2018.

Für das gemeinsame Experiment von Huyghe und Kamitani wurde den Freiwilligen gesagt, dass sie sich bestimmte Bilder ansehen oder sich vorstellen sollten, während ihre Gehirnaktivität von einem MRT-Scanner erfasst wurde. Die erzeugten Daten wurden in ein neuronales Netzwerk eingespeist. Dieses Netzwerk sollte dann die MRT-Daten rückwärts extrapolieren, um die ursprünglichen Bilder oder Gedanken wiederherzustellen. Anschließend wurden die Gehirnbilder von einer KI rekonstruiert, indem sie sie mit Elementen aus ihrer eigenen Bilddatenbank zusammenfügte. Tausende Versuche der Software, visuelle Darstellungen eines menschlichen Gedankens zu konstruieren, wurden anschließend auf großen LED-Bildschirmen in der Galerie verteilt präsentiert. Doch noch etwas fällt auf: Der Raum ist voller Schmeißfliegen, die sich summend an den hellerleuchteten Bildschirmen tummeln.

Hier treffen also tierische, menschliche und künstliche Intelligenz aufeinander und das in einem vollkommen gleichwertigen Verhältnis zueinander, sodass nicht einmal klar ist, ob die Ausstellung für uns Menschen oder für die Fliegen da ist. Indem Huyghe den Menschen als „Krone der Schöpfung“ nicht mehr Beachtung als Fliegen zukommen lässt, verweist er auf den möglichen Verlust dieser Vormachtstellung durch die KI-Technologie in der Zukunft.

Schon Leonardo Da Vinci stellte im 15. Jahrhundert fest: „Tristo è quel discepolo che non avanza il sua maestro“ (Armselig der Schüler, der seinen Meister nicht übertrifft). Glaubt man den warnenden Worten zahlreicher Wissenschaftler:innen und Science-Fiction-Autor:innen, besitzen KIs tatsächlich das Potenzial uns irgendwann zu übertreffen, und zwar in jeglicher Hinsicht. Vielleicht wird eines Tages also eine gottgleiche künstliche Superintelligenz die Welt beherrschen, plötzlich entscheiden, dass wir Menschen obsolet geworden sind und uns alle kurzerhand auslöschen. Oder wir leben irgendwann in einer Art symbiotischen Beziehung mit künstlicher Intelligenz, die es uns ermöglicht, Unglaubliches zu vollbringen. Zugegeben, die Ergebnisse des Projekts von Huyghe sind verbesserungswürdig, aber was, wenn diese Technologie erst der Anfang ist? Wo wird es uns hinführen, wenn wir Software direkten Zugang zu unserem Denken gewähren? Was bleibt dann noch von uns als Menschen übrig?


Neben unserer Intelligenz zeichnet uns vor allem unser Gefühlsreichtum aus. Eine künstliche Intelligenz verarbeitet Daten. Sie kennt so etwas wie Freude, Trauer, Wut oder Liebe nicht. Wie auch? Schließlich können wir nichts erschaffen, was wir nicht einmal selbst verstehen. Durch die Erfindung des Internets und das Aufkommen von Quantencomputern wurde KI-Technologie erstmals möglich. Heute befinden wir uns bereits inmitten eines der größten technologischen Wandel in der Geschichte der Menschheit. Er wird verändern, wie wir leben, aber auch was wir als ein Kunstwerk verstehen. Für beinahe zwei Jahrhunderte glaubten wir zum Beispiel, die Fotografie sei etwas, das von Menschen für Menschen geschaffen wurde. Seit ihrer Erfindung haben sich zwar ihre Produktionsverfahren, Verbreitungstechniken und die Konsumgewohnheiten der Rezipient:innen grundlegend verändert, aber die Tatsache, dass ein Foto immer die Perspektive einer anderen Person – des:der Fotograf:in – zeigt, ist weitestgehend unbestritten. Doch was passiert, wenn Maschinen anfangen zu fotografieren? Was passiert, wenn Maschinen anfangen zu sehen?

Der US-amerikanische Fotokünstler Trevor Paglen hat es zu seiner Mission gemacht, das zu erforschen. Sein neuestes Ziel: Die unsichtbaren und sich schnell entwickelnden Technologien der Computer Vision. In den letzten zehn Jahren haben leistungsfähige Algorithmen und neuronale Netzwerke es Computern ermöglicht, autonom zu sehen. Aber was hat das zu bedeuten, wenn das Sehen keine:n menschliche:n Seher:in mehr erfordert? Dies ist der fruchtbare Boden für Paglens Ausstellung bei Metro Pictures in New York mit dem Titel „A Study of Invisible Images“. In seiner fotografischen Serie „Adversarially Evolved Hallucinations“ ließ der Künstler zwei KI-Systeme – ein bilderkennendes und ein bildgenerierendes – aufeinander reagieren. Der Titel der Arbeit spielt auf die Generative Adversarial Networks (GANs) an, wörtlich „erzeugende gegnerische Netzwerke“. Paglen trainierte dabei eine KI mit Bildern, die in unterschiedlichen Taxonomien z.B. „Monsters of Capitalism“, also Bildern, die historisch als Allegorien für den Kapitalismus gelten, klassifiziert wurden. Eine zweite KI reagierte auf den Input und erzeugte auf dieser Grundlage ihre eigene künstliche Bildwelt. Was dabei herauskam, war ein abstraktes Abbild eines blutsaugenden Vampires, welcher der Arbeiterklasse langsam das Leben entzieht. Wir werden dabei Zeug:innen genuiner maschineller Imaginationsprozesse, die auf den jeweiligen Bildsammlungen und Kategorien basieren, an denen die erzeugenden Systeme trainiert wurden. Sichtbar geworden sind also die Bilder, die Algorithmen über bestehende Bilder legen, um sie auszulesen. Anders formuliert: Es handelt sich um eine Visualisierung der Gedanken der KI.

Trevor Paglen, Vampire (Corpus: Monsters of Capitalism), Adversarially Evolved Hallucination, 2017, Dye Sublimation metal print, 156.5 x 125.7 cm, Metro Pictures, New York.


Das Video mit dem Titel: „Behold These Glorious Times!“ vereint Hunderttausende von Bildern, die mit schwindelerregender und zugleich hypnotischer Geschwindigkeit über 12 Minuten auf den Bildschirm aufblitzen. Es erinnert an eine Gehirnwäsche, doch in Wahrheit stammen diese Fotos aus den Trainingsbibliotheken, die verwendet werden, um der künstlichen Intelligenz das Sehen beizubringen. Dieser Prozess, bei dem die KI nach dem Vorbild unseres Gehirns mit Hilfe künstlicher neuronaler Netze lernt, Bilder mit Worten zu verknüpfen, wird Deeplearning genannt. Im weiteren Verlauf des Videos zerfallen die Bilder in immer mehr Grundformen: Schwarz-Weiß Raster, subtile Schattierungen. Um Bilder zu erkennen, wird der KI also beigebracht, jedes Bild zu zerlegen, seine grundlegendsten Teile zu analysieren und dadurch das Ganze zu verstehen. Dieser beinahe betäubende und fesselnde Prozess wird von einem Opern-Soundtrack begleitet, der selbst ein Produkt von Algorithmen ist: Die Klänge stammen aus einer auditiven Trainingsbibliothek, mit der Maschinen das Erkennen menschlicher Sprache beigebracht wird. Beim Betrachten des Videos wird das Gehirn also gar nicht gewaschen, sondern computerisiert. In der Zukunft wird die Welt vielleicht für ihre künftigen Bewohner:innen genauso aussehen und klingen.


Trevor Paglen, Behold These Glorious Times!, Installation view at A Study of Invisible Images, 2017. Metro Pictures, New York. (Photo: Genevieve Hanson).

Doch eins steht fest: Maschinell erstellte Bilder werden mehr und mehr viele grundlegende Elemente unseres Lebens bestimmen – wie wir uns bewegen (selbstfahrende Autos), was wir konsumieren (automatisierte Fließbänder und Fulfillment-Center) und sogar, wie wir miteinander interagieren (Gesichtserkennung als Mittel der sozialen Kontrolle). In Paglens neuster Ausstellung „A Thousend Flowers“ ist unter anderem sein innovatives und interaktives Kunstwerk ImageNet Roulette (2020) enthalten, das seine Zuschauer:innen nach dem am weitesten verbreiteten Trainingsset in der Forschung und Entwicklung von Computer Vision klassifiziert. Das Kunstwerk löste eine große Kontroverse aus, als es im Rahmen der Ausstellung „Training Humans“ von Paglen und der KI-Forscherin Kate Crawford in der Fondazione Prada erstmals veröffentlicht wurde. Die Arbeit zeigte, dass ImageNet, ein 2009 an der Princeton University und der Stanford University entwickelter und in unzähligen Systemen zur Bildklassifizierung und künstlicher Intelligenz verwendeter Datensatz, nicht nur pseudowissenschaftlich in seiner Konstruktion, sondern aktiv rassistisch, frauenfeindlich, ableistisch und LGBT-phobisch war. Umso beunruhigender (aber nicht überraschend) ist es, dass ImageNet auch die KIs von Behörden und Polizeikräften trainiert.

Also eine KI mit Vorurteilen? Ja, denn Maschinen übernehmen die Weltbilder ihrer Lehrer. Paglen und sein Team haben, um diese Problematik zu verdeutlichen, hunderte Fotos der Künstlerin Hito Steyerl durch einen Algorithmus klassifizieren lassen. Für die KI ist sie in diesem Bild zum Beispiel „57 Prozent weiblich“ und „43 Prozent männlich“.

Trevor Paglen, Machine Readable Hito (Detail) from A Study of Invisible Images, 2017 adhesive wall material, 490.2 x 140 cm, Metro Pictures, New York.

An diesem Punkt wird es problematisch, denn dass die Analyse nur „Mann“ und „Frau“ kennt, ist eine politische Entscheidung. Außerdem wird dadurch vorausgesetzt, dass es jemanden gibt, der 100% weiblich ist, aber wer entscheidet das? Was wie eine Beschreibung klingt, ist in Wirklichkeit ein Urteil. Die Bezeichnung künstliche Intelligenz suggeriert, dass es sich dabei um etwas Intelligentes handeln würde, aber in Wahrheit ist hier gar nicht so viel Intelligenz im Spiel. Sie basiert allein auf Statistik, sodass automatisch alle kulturellen Vorurteile und Verzerrungen unserer Gesellschaft in die Systeme selbst eingebaut sind. Und das könnte, wie man sich sicher vorstellen kann, schwerwiegende politische und kulturelle Auswirkungen haben.

So gibt es beispielsweise bereits heute ein Sicherheitssystem, das damit wirbt, Ladendiebstähle verhindern zu können, und das noch bevor sie überhaupt passieren. Die von dem japanischen Startup Vaak entwickelte KI-Software greift dabei auf das Material der Überwachungskameras zu, analysiert die Kund:innen und warnt das Personal vor potenziellen Dieb:innen. Was wie ein Ausschnitt aus dem Film Minority Report klingt, wird laut dem CEO Ryo Tanaka bereits in einigen namenhaften Laden-Ketten eingesetzt. Doch anhand welcher Parameter entscheidet die KI? Alter, Geschlecht, Herkunft, Verhalten? Wird Diskriminierung und Rassismus in der Zukunft also zunehmen und vielleicht sogar die Demokratie in ihren Grundfesten gefährden? Wie weit verlieren wir die Fähigkeit, uns selbst zu definieren im Kontext von autonomen Systemen?

Die Entscheidungsmacht liegt vielleicht irgendwann allein bei Regierungen und digitalen Großkonzernen, denen wir praktisch ausgeliefert sind. Es ist allgemein bekannt, dass Apple, Google, Facebook und Amazon Milliarden in künstliche Intelligenz investieren. Sie filtern Inhalte, sammeln unsere Daten, können uns identifizieren, tracken unsere Gewohnheiten und kennen unsere intimsten Gedanken. Diese Entwicklung gesetzlich auch nur einschränken, will bisher keine einzige Regierung weltweit. Paglen möchte mit seiner Kunst auf die Gefahren dieser Entwicklung aufmerksam machen.

Um aber auf die eingangs gestellte Frage zurückzukommen: Wahrscheinlich sind KIs nicht die Künstler:innen der Zukunft. Es gibt jedoch einige Künstler:innen, die mit KIs zusammenarbeiten oder sie als Inspirationsquelle nutzen sowie Künstler:innenkollektive oder Tech-Firmen, die Gemälde komplett von KIs fertigen lassen. KI hat also schon seit geraumer Zeit den etablierten Kunstmarkt erreicht, aber ob sie die Kunst- und Kulturlandschaft in Zukunft dominieren wird, bleibt abzuwarten. Künstliche Intelligenz ist (nach heutigem Stand) nur ein menschengemachter technischer Vorgang. Das unterscheidet sie von tierischer Intelligenz und genau darin liegt auch der springende Punkt: So wie für Spinnen ihre selbstgesponnenen Netze eine Erweiterung ihres Körpers sind, sind es für uns vielleicht bald neuronale Netzwerke und KI-Technologie. 

Wir haben als Gesellschaft dabei eine Verantwortung, wie wir mit dieser neu gewonnenen Technologie umgehen wollen, und an dieser Stelle kann uns die Kunst dabei helfen, ihre Potenziale und Problematiken besser einschätzen zu können. Durch das Experimentieren mit ihr können wir das große Ganze sichtbar machen und darüber nachdenken, was es eigentlich bedeutet, wenn wir keine Menschen mehr brauchen, um Bilder anzuschauen. Viele halten diese Entwicklung für noch bedeutender als die Erfindung der Fotografie oder der perspektivischen Malerei. Denn indem wir verstehen, wie Computer Informationen verarbeiten und ihnen Bedeutungen zuweisen, können wir herausfinden, wie sich grundlegende Regeln unseres Zusammenlebens in der Zukunft verändern werden. Sicher, Künstler:innen können nicht hellsehen, aber sie lassen uns die Zukunft erahnen. Sie zeigen, wie sehr wir auf allen Ebenen vernetzt sein werden. Ihre Kunst ist dabei unser Spiegel, durch den wir heute schon einer Zukunft näherkommen können, die wir uns wünschen und nicht eines Tages von ihr heimgesucht werden.

von Adriana Correa