Die Schweiz aus Sicht einer KI
Memes, Kunst und Schweizer Momente: Künstliche Intelligenz trifft auf Tradition.
Stell dir vor, du könntest jedes beliebige Bild nehmen und es mit künstlicher Intelligenz in etwas völlig Neues und Überraschendes verwandeln. Du wirst erstaunt sein, wie die generative Füllfunktion von Photoshop Beta deine Ideen zum Leben erweckt und deine Kreativität auf eine noch nie dagewesene Weise herausfordert!
In einem beeindruckenden und mitreissenden Video habe ich diese faszinierende Technologie angewendet und eine Auswahl von 18 Bildern zusammengestellt, die den Charme und die Traditionen der Schweiz in einem künstlerischem Twist widerspiegeln. Erlebe eine fesselnde Fusion aus Kunst, Politik und Memes, die dich gleichermassen zum Staunen, Schmunzeln und Nachdenken bringen wird.
(stm)
Idee und Motivation
Vor knapp einem Monat (am 23. Mai 2023) hat Adobe eine Beta-Version von Photoshop mit der Funktion «Generative Fill» vorgestellt. Diese Funktion wurde in der gesamten KI-Community stark diskutiert und hat auch mittlerweile in den sozialen Medien an Popularität gewonnen. Ich habe bereits zuvor in meinem Projekt «Erkennst du das Original?» generative Füllfunktionen ausprobiert und hatte viel Spass dabei. Daher wollte ich nun einen Vergleich zur Photoshop Beta-Version ziehen. Meine Idee war es, mehrere Bilder von bekannten Schweizer Momenten, Kunstwerken und Memes mithilfe von künstlicher Intelligenz zu erweitern.
Umsetzung
- Bevor ich mit der Erstellung der Bilder begann, habe ich darüber nachgedacht, was zur Schweiz gehört und was typisch ist. Welche Bilder sind mir im Kopf geblieben? Welche Sehenswürdigkeiten gibt es? Was sollten Schweizer kennen? Welche Schweizer Prominente, Sportler, Musiker, Künstler, Schriftsteller, Architekten und Moderatoren gibt es? Ich habe eine umfangreiche Brainstorming-Liste erstellt und daraus bestimmte Elemente ausgewählt. Da ich vorhatte, ein YouTube Short-Video zu erstellen, das kürzer als eine Minute ist, habe ich mich auf 18 Bilder festgelegt. Diese 18 Bilder habe ich nach ihrem Bekanntheitsgrad sortiert und um den Schweizer Charme zu widerspiegeln, habe ich sie gleichmässig auf Kunst, Politik und Memes aufgeteilt.
- Nachdem ich mein Ziel vor Augen hatte, machte ich mich ans Einrichten: Ich habe Photoshop Beta gestartet und ein leeres Platzhalterbild mit den richtigen Einstellungen (1080×1920) erstellt. Dieses Dokument habe ich dann 18 Mal kopiert. Anschliessend habe ich im Internet nach den entsprechenden Bildern gesucht und sie heruntergeladen. Ich habe die Bilder dann maskiert und sie in einem leeren Bereich der Arbeitsfläche platziert. Um die Bilder generativ zu füllen, habe ich einen Auswahlbereich um das Bild herum festgelegt und die automatische Bildgenerierung gestartet. Es kommt jedoch selten vor, dass ein generiertes Bild sofort perfekt aussieht. Nach jeder Manipulation konnte ich zwischen drei Varianten wählen. Falls keines der Ergebnisse zufriedenstellend war, habe ich eine erneute Bildgenerierung durchgeführt. Diesen Vorgang habe ich so oft wiederholt, bis das Bild meinen Vorstellungen entsprach. Manchmal habe ich dem Bild auch eine gewisse Lenkung gegeben, indem ich einen Begriff eingegeben habe. Das Programm hat dann nach einer kurzen Ladezeit ein passendes Bild generiert. Nachdem ich ein Bild fertiggestellt hatte, habe ich es gespeichert und die generierten Ebenen wieder ausgeblendet, um auch das Originalbild abzuspeichern.
- Nachdem alle 18 Bilder generiert wurden, importierte ich sie in Adobe Premiere und schnitt sie passend zu einer hysterisch getakteten Musik zusammen. Zusätzlich zu einem kurzen Intro schloss ich das Video mit fesselnden Zoom-Effekten ab, um eine spannungsgeladene Atmosphäre zu erzeugen. Das fertige Video wurde für YouTube exportiert und in meinem eigenen YouTube Kanal hochgeladen.
Learnings und Fazit
Bei der Verwendung von Photoshop Beta sind einige Schwierigkeiten aufgetreten: Abstürze, Wartezeiten und mehrere Versuche, bis alles geklappt hat. Einige meiner Bilder wurden fälschlicherweise von den Richtlinien als Verstoss eingestuft, obwohl sie völlig harmlos waren. Beispielsweise konnte ich die Begriffe «Streik» oder «Messer» nicht direkt eingeben. Ich musste kreativ sein und alternative Begriffe verwenden, um das Problem zu umgehen. Anstatt «Streik» kann man zum Beispiel «Friday for Future» eingegeben, und anstatt «Messer» hilft ein «Küchenmesser». Im Laufe meiner Arbeit lernte ich das Programm immer besser kennen und wurde mit der Verwendung von Prompts vertrauter. Dabei fand ich heraus, dass es wichtig ist, weder zu viel noch zu wenig einzugeben. Ein möglichst präziser Beschreibung mit Subjekt + Verb + Adjektiv und Objekt(en) erwies sich für mich als die effektivste Methode. Ich muss zugeben, dass die Erstellung schöner Bilder (noch) zeitaufwendig war, insbesondere bei Gesichtern hatte das Programm noch Schwierigkeiten. Bei einigen Bildern musste ich viel Zeit in die Feinabstimmung investieren (zum Beispiel bei der Torte), wodurch ich manchmal über 50 zusätzliche Ebenen erstellt habe. Gelegentlich musste ich das Licht mit Filtern anpassen oder die Masken korrigieren. Besonders bei Bildern, die mindestens zwei Elemente kombinieren sollten, war der Aufwand höher. Nichtsdestotrotz hatte ich viel Spass beim Generieren und Prozess der Bildentwicklung. Die Beta-Version von Photoshop finde ich persönlich besser als Stable Diffusion. Die Benutzerfreundlichkeit und die Möglichkeit, die Grösse der Bilder beliebig anzupassen, sind definitiv grosse Pluspunkte. Abschliessend kann ich sagen, dass die generierten Bilder äusserst faszinierend und oft auch humorvoll sind. Sie sehen auf den ersten Blick sogar echt aus. Ich plane auch zukünftig mit dem Programm zu arbeiten, da es eine enorme Zeitersparnis bietet. – Die ehemalig mühsame Retuschenarbeit kann nun endlich mit nur einem Klick umgangen werden.