Wie Van Gogh mich portraitierte

Okay, Van Gogh ist schon seit über 100 Jahren gestorben. Leider hat er nicht wirklich ein Portrait von mir gezeichnet. Aber trotzdem ist es heutzutage möglich, Portraits in seinem Zeichenstil zu bekommen. Wie dies möglich ist? Artificial Intelligence.

In 2022 war eine enorm grosse Entwicklung in der Künstlichen Intelligenz zu beobachten. Sei es in den Sozialen Medien aber auch in den Nachrichten. Seit Beginn dieses Semesters bin ich begeistert davon. Wöchentlich oder eigentlich schon fast täglich kommen neue AI-Tools auf die Welt. Von Tag zu Tag werden diese besser.

Ich habe recherchiert, was für Projekte realisierbar sind und entschied mich dazu, eine KI auf mein Gesicht zu trainieren.

Als aller erstes brauchte ich Bilder von mir. Ich mache selten Fotos und deshalb brauchte ich ein paar neue. Wichtig dabei war es, dass die Bilder unterschiedlich sind. Also musste ich verschiedene Outfits tragen und die Bilder an verschiedenen Orten aufnehmen. Auch die Blickwinkel musste ich von Bild zu Bild anpassen. Denn die KI kann nur mit dem arbeiten, das sie gelernt hat.

Als ich 21 Bilder hatte, musste ich diese alle quadratisch und klein zuschneiden. Dies hilft der KI bessere Ergebnisse zu liefern.

Danach ging es darum die KI zu trainieren. Ich entschied mich dazu Stable Diffusion über Google Colab laufen zu lassen. Google Colab ist ein Dienst bei dem in der Cloud über gute Grafikkarten gearbeitet werden kann.

Es war soweit, die KI kannte mein Gesicht. Voller Vorfreude gab ich die erste Texteingabe ein: «photo of sofiyan, drawing van gogh, award winning, artwork». Ich staunte, denn das Ergebnis war besser als erwartet.

Hier eine Auswahl der besten generierten Portraits. Das letzte Bild ist eines welches ich der KI als Training gegeben habe damit ihr sehen könnt ob die KI einen guten Job gemacht hat.

Die Arbeit sieht so aus. Per Texteingabe wird das Wunschergebnis gewählt. Die Bildgrösse und die Anzahl an Bilder kann definiert werden. Hier habe ich eine kleine Bildgrösse gewählt damit die KI weniger Rechenleistung braucht, später wird das Bild mit einer anderen KI hochskaliert. Einige technische Einstellungen können auch noch definiert werden, aber dies wäre jetzt zu unverständlich.

Übrigens, ein paar Monate nachdem ich mit diesem Projekt begonnen hab, bekam die App «Lensa» ein neues AI Portrait Feature. Für 4$ erstellt es 200 generierte Portraits von dir. Es ist jedoch nicht ganz das gleiche. Meine Arbeit war kostenlos und im Gegensatz zu Lensa konnte ich per Texteingabe mein Wunschergebnis eingeben.

(bas)

Idee

Schon im letzten Semester bemerkte ich, dass immer wie mehr KI Content in den Sozialen Medien zu sehen sind. Das Thema ist meiner Meinung nach sehr spannend und wird uns alle in Zukunft begleiten. Als Thesis für meine Bachelorarbeit wollte ich etwas mit KI. Damit ich mich bereits jetzt mit dem Thema auseinandersetze entschied ich mich dazu Digezz Projekte in Verbindung mit KI zu erstellen. Der Einstieg in die Thematik ist nicht sehr leicht. Es braucht eine gewisse Recherche und viel learning by doing. Eine KI auf sein Gesicht zu trainieren ist daher im Vergleich zu anderen KI Projekten noch eher simpel. Trotzdem war nicht alles immer einfach.

Umsetzung

Einen Grossteil der Umsetzung habe ich bereits oben erklärt. Es war für mich das erste mal, dass ich eine KI trainiert habe und ich hatte wenig Ahnung davon. Ich musste viel recherchieren. Da ich nicht mehr die beste Grafikkarte besitze und meistens an meinem Mac Book bin entschied ich mich dafür Google Colab zu verwenden. Dies funktioniert so, dass Python Code bereits voreingestellt ist und man selbst einige Felder ausfüllen muss. Aber es kann schnell vorkommen, dass irgend ein Fehler passiert und dann der ganze Code falsch ist. Glücklicherweise hatte ich selten solche Probleme. Einmal wusste ich jedoch nicht weiter und habe die KI nochmal neu trainiert. Ich sass teils stundenlang und generierte Portraits. Dies da nicht jede Texteingabe immer ein gutes Ergebnis gibt und weil ich pro Texteingabe bestimmt 1 bis 2 Minuten warten musste.

Fazit

Das Projekt hat mir sehr viel Spass gemacht. Es waren meine ersten grossen Berührungspunkten mit der Künstlichen Intelligenz in diesem Bereich. Als die App «Lensa» ihren Hype hatte, war ich für kurze Zeit genervt. Alle können ähnliche Ergebnisse bekommen in dem sie Geld ausgeben, während ich mehrere Stunden am Tag für gute Ergebnisse arbeitete. Danach ist mir jedoch aufgefallen, dass die Ergebnisse bei Lensa weniger individuell sind und der Hype nicht für eine lange Zeit anhalten kann.

Ich habe bei diesem Projekt sehr viel zum Thema KI dazugelernt. Ich bin sehr gespannt was die Zukunft bringt und bin mir sicher, dass KI auch in unserem Berufsfeld immer mehr von Bedeutung bekommt. KI ist kein Trend sondern KI wird die Zukunft.