banner
Heim / Nachricht / FRIDA, ein KI-Roboter, kann malen. Aber macht es Kunst?
Nachricht

FRIDA, ein KI-Roboter, kann malen. Aber macht es Kunst?

Aug 14, 2023Aug 14, 2023

Werbung

Unterstützt durch

Geist

Forscher der Carnegie Mellon University haben einen KI-gestützten Arm entwickelt, der abstrakte Acrylfarben malen kann. Ist es Kunst?

Von Oliver Whang

Für mehr Audiojournalismus und Storytelling laden Sie New York Times Audio herunter, eine neue iOS-App für Nachrichtenabonnenten.

Kürzlich war eines Tages auf einem Tisch in Jean Ohs Labor im Stadtteil Squirrel Hill in Pittsburgh ein Roboterarm damit beschäftigt, eine Leinwand zu bearbeiten. Langsam, als ob die Luft zähflüssig wäre, tauchte es einen Pinsel in eine Lache hellgrauer Farbe auf einer Palette, schwenkte herum und strich über die Leinwand, wobei er inmitten einer Ansammlung anderer Pinselstriche einen zentimeterlangen Abdruck hinterließ. Dann zog es sich zurück und hielt inne, als wollte es seine Arbeit beurteilen.

Die Striche, größtenteils in unterschiedlichen Grautönen, ließen auf etwas Abstraktes schließen – vielleicht auf einen Ameisenhaufen. Dr. Oh, der Leiter der RoBot Intelligence Group an der Carnegie Mellon University, gekleidet in ein Sweatshirt mit der Aufschrift „There Are Artists Among Us“, schaute zustimmend zu. Ihr Doktorand Peter Schaldenbrand stand daneben.

Dr. Ohs Arbeit, die Robotervision und Themen der autonomen Luftfahrt umfasst, berührt oft die sogenannte Sim-to-Real-Lücke: wie Maschinen, die in einer simulierten Umgebung trainiert werden, in der realen Welt agieren können. In den letzten Jahren hat Herr Schaldenbrand die Bemühungen vorangetrieben, die Sim-to-Real-Lücke zwischen anspruchsvollen Bilderzeugungsprogrammen wie Stable Diffusion und physischen Kunstwerken wie Zeichnungen und Gemälden zu schließen. Dies zeigte sich vor allem im Projekt FRIDA, dessen neueste Version in einer Ecke des Labors rhythmisch vor sich hin surrte. (FRIDA ist ein Akronym für Framework and Robotics Initiative for Developing Arts, obwohl die Forscher das von Frida Kahlo inspirierte Akronym wählten, bevor sie entschieden, wofür es stand.)

Der Übergang von sprachlichen Eingabeaufforderungen zu pixeligen Bildern und Pinselstrichen kann kompliziert sein, da der Roboter „den Lärm der realen Welt“ berücksichtigen muss, sagte Dr. Oh. Aber sie, Herr Schaldenbrand und Jim McCann, ein Robotiker an der Carnegie Mellon, der auch an der Entwicklung von FRIDA beteiligt war, glauben, dass es sich lohnt, die Forschung aus zwei Gründen fortzusetzen: Sie könnte die Schnittstelle zwischen Mensch und Maschine verbessern und durch Kunst helfen Menschen miteinander verbinden.

„Diese Modelle werden auf der Grundlage aller Daten trainiert“, sagte Dr. McCann und bezog sich dabei auf die großen Sprachmodelle, die Tools wie ChatGPT und DALL-E unterstützen. „Und deshalb denke ich immer noch, dass wir herausfinden, wie Projekte wie dieses, die solche Modelle verwenden, den Menschen einen Mehrwert bieten können.“

Die Lücke zwischen Simulation und Realität stellt Robotiker und Computeringenieure vor ein überraschend kniffliges Problem. Einige künstliche Intelligenzsysteme können die beim Gehen erforderlichen Schritte auflisten (anspannen Sie Ihren Quadrizeps und beugen Sie Ihre Schienbeine nach hinten, neigen Sie Ihr Gewicht nach hinten und spannen Sie Ihren großen Gesäßmuskel an) und können einen simulierten Körpergang in einer virtuellen Welt durchführen. Es ist also verlockend zu glauben, dass diese Systeme einen physischen Körper in der realen Welt leicht zum Laufen bringen könnten.

Nicht so. In den 1980er Jahren stellte der Informatiker Hans Moravec fest, dass KI gut darin sei, komplizierte Überlegungen anzustellen und große Datenmengen zu analysieren, dass sie jedoch bei einfachen körperlichen Aktivitäten wie dem Aufheben einer Flasche Wasser schlecht sei. Dies ist als Moravecs Paradoxon bekannt. (Die physische Überlegenheit des Menschen könnte durch die lange Evolutionsgeschichte unseres Körpers erklärt werden; die Aufgaben, die für uns einfach sind, werden durch Millionen von Jahren darwinistischer Experimente gestützt.)

In der Malerei, die oft konzeptionelle Ideen und grundlegende körperliche Handlungen vermischt, wird das Paradox deutlich: Wie schaffen wir es, die Absurdität des menschlichen Bewusstseins mit den Bewegungen eines Arms einzufangen?

KI-Bilderzeugungstools wie Midjourney, DALL-E und Stable Diffusion werden trainiert, indem neuronale Netze mit riesigen Bilddatenbanken und entsprechenden Textbeschreibungen gefüttert werden. Das programmierte Ziel besteht darin, die Beziehungen zwischen der Bedeutung von Wörtern und den Merkmalen von Bildern zu modellieren und diese Beziehungen dann in einem „Diffusionsmodell“ zu verwenden, um Originalbilder zu erstellen, die die Bedeutung bestimmter Beschreibungen beibehalten. (Die Eingabeaufforderung „Eine Familie picknickt im Park“ erzeugt bei jeder Verwendung ein neues Bild; jedes Bild ist als Familie beim Picknick im Park verständlich.)

Solche Bilder existieren jedoch nur in der Simulationswelt von Computern und bestehen aus Pixeln unterschiedlicher Farbe und Intensität. Verlassen Sie die Simulation und das Bild bleibt zurück.

Um dieses Problem zu lösen, berücksichtigten Dr. Oh und ihre Kollegen die Körperlichkeit von FRIDA. An einer Wand in ihrem Labor hängt ein Blatt Papier mit 130 verschiedenen Pinselstrichen in Schwarz: Schnörkel und Linien, manche lang und gerade, manche kaum mehr als Punkte. Die Markierungen stellen den Bewegungsbereich des Roboters dar und wurden in sein Diffusionsmodell programmiert.

„ Wir machen Fotos von den Pinselstrichen, modellieren diese Interaktion und erhalten dann eine wirklich genaue Simulation der Pinselstriche, die auf den tatsächlichen Fähigkeiten des Roboters basiert“, sagte Schaldenbrand. Wenn das Modell dazu aufgefordert wird, erstellt es ein Bild einer Froschballerina in Pixeln, allerdings nur in Konfigurationen, die der Roboter mit diesen 130 Pinselstrichen malen kann.

Die Forscher entwickelten außerdem eine Möglichkeit, mit der der Roboter gelegentlich von seinem Gemälde zurücktreten kann, um zu messen, wie nah er in Pixeln an dem Ziel war, das er generiert hatte, und um dieses pixelige Ziel dann zu überarbeiten. Ein eigensinniges Zeichen könnte die Bewegung der springenden Froschballerina oder die hochgezogene Augenbraue einer Person im Publikum sein. Also löste sich FRIDA alle paar Dutzend Pinselstriche von der Leinwand, machte ein Foto von ihrem bisherigen Werk, hielt inne und machte sich dann wieder an die Arbeit.

„So machen es vielleicht menschliche Künstler“, sagte Dr. Oh. „Fügen Sie einige Pinselstriche hinzu, schauen Sie sich dann noch einmal die gesamte Leinwand an und planen Sie neu. Wir wollten diesen Prozess nachahmen.“ In gewisser Weise ein Prozess der künstlerischen Selbstfindung, wenn auch ein mechanisierter, algorithmischer und statistischer.

Die Ergebnisse dieser Methoden werden im Labor ausgestellt. Porträts von Professoren, historischen Persönlichkeiten, Landschaften, Stadtansichten, dieser Froschballerina, alles in einem unverwechselbaren, abstrakten Stil – sogar ein Selbstporträt des ersten FRIDA-Roboters. Die Konsistenz der Gemälde lässt auf eine einheitliche künstlerische Vision schließen, für die Herr Schaldenbrand, Dr. McCann und Dr. Oh keine Anerkennung beanspruchen wollen. Sie schreiben jedes der Werke FRIDA zu.

Aber könnte FRIDA ein Werk ohne Testament, Herz und Fingernägel haben? Kann ein Roboter ein Künstler sein?

Amy LaViers, Informatikerin und Tänzerin, die das Robotics, Automation and Dance Lab, eine unabhängige gemeinnützige Organisation, leitet, sagte, solche Fragen würden nicht so verrückt oder beängstigend erscheinen, wenn die Menschen bereit wären, die harte Unterscheidung zwischen Künstler und Künstler aufzulösen Mittel. Alles – ob Aquarell oder KI-Bildgeneratoren oder der Wunsch nach Ausdruckskraft – ist in der Kunst verpackt. Sogar etwas so Einfaches wie Farbe kann scheinbar einen eigenen Willen haben, und ein Maler muss auf die Art und Weise reagieren, wie sie über die Leinwand gleitet. Dr. LaViers schlug vor, FRIDA eher als „Roboterpinsel“ denn als Malroboter zu betrachten.

„Es gibt Dinge, die man mit künstlichen Körpern machen kann, die Menschen nicht können“, sagte sie. „Es erweitert die Palette des menschlichen Ausdrucks.“

Dr. Oh betonte, dass bei FRIDAs Gemälde immer noch Menschen im Wesentlichen beteiligt seien. Sie steuern die Maschine und mischen die Farben, richten die Leinwand ein und begrenzen die Gesamtzahl der Pinselstriche in jedem Stück. Die Datensätze, mit denen FRIDA und andere Bildgeneratoren trainiert werden, enthalten Gemälde und Fotografien, die von anderen Personen erstellt wurden. Aber, fügte Dr. Oh hinzu, das Ziel sei nie gewesen, etwas zu schaffen, das mit menschlichen Künstlern konkurrieren könne. „Wir wollen die menschliche Kreativität fördern“, sagte sie. „Wir möchten, dass die Menschen ihre Gedanken auf unterschiedliche Weise ausdrücken.“

Im Labor beobachtete Herr Schaldenbrand, wie aus FRIDAs bewussten grauen Pinselstrichen langsam ein Gemälde entstand: eine neblige Straße, die Formen von Autos, Rücklichter. „Das ist schwer zu erklären“, sagte er. „Ich möchte nicht den falschen Eindruck erwecken, dass hier ein Bewusstsein im Gange ist. Aber es macht manchmal Spaß, so zu tun.“

Audio produziert von Adrienne Hurst.

Oliver Whang ist ein in Brooklyn lebender Autor. Er begann 2020 für The Times zu schreiben. Mehr über Oliver Whang

Werbung