Bilderchaos adé: Wie KI hilft, Ordnung in deine Fotosammlung zu bringen

Wer von KI spricht, hat verschiedene Dinge im Kopf. Die einen meinen, dass KI Texte aus dem Nichts generiert. Andere denken, man könnte damit aus großen Datenmengen Informationen herauslesen. Wieder andere denken an intelligente Roboter. Oft wird auch das Szenario der Automatisierung genannt. Aber kaum jemand weiß eigentlich so richtig, was das bedeutet und wie man das umsetzen kann.

Wenn wir Automatisierung hören, dann öffnet sich zumindest in meinem Kopf das Bild, dass unsichtbare digitale Hände etwas anfassen, bewegen, vielleicht auch anschauen können und es dann woanders hinlegen. Vielleicht sogar dieses Etwas in eine andere Form bringen. Das ist sehr abstrakt und ich glaube, deswegen reden alle nur vom Automatisieren und tun es nicht.

Fokus auf die unscheinbaren Aufgaben

Ich habe mir zum Ziel gesetzt, künstliche Intelligenz für die gefühlt und auf den ersten Blick langweiligen Aufgaben zu nutzen. Aber gerade diese langweiligen Aufgaben sind mitunter so schwierig, dass sie niemand anpackt. Obwohl jeder darüber redet und es gerne anders hätte, wird es oft an der Seite liegen gelassen und dafür lieber Projekte angestoßen, die viel Glanz haben, aber nicht unbedingt den großen Einfluss auf Produktivität und die Arbeitslebensqualität haben.

Ein solches Beispiel sind Bilder. Wahrscheinlich hast du auch ganz viele Bilddateien auf deiner Festplatte liegen, die so heißen wie p735xyz.jpg. Ich habe bis vor kurzem bei einer Plattform gearbeitet, die sehr viele Bilder gespeichert hat. Und jedes Bild heißt anders.

Das Problem unbenannter Bilddateien

Suchte ich also ein Bild, dann gab es keine Bilderdatenbank, weil die ja gepflegt werden müsste. Und außerdem gab es sie ja auch gar nicht. Also ging ich in einen Ordner, in dem genau diese benannten Bilder lagen. Ich musste also entweder die Miniatur-Bildübersicht anschauen und dann vielleicht das richtige Bild suchen oder mich durch die einzelnen Bilder durchklicken. Ganz ehrlich, das macht halt niemand mehr.

Aber die Arbeit, jedes Bild anzuklicken, herauszufinden, was das eigentlich ist, vielleicht den Kontext, die Bildgröße und noch mehr, macht halt keiner. In 34 Jahren habe ich als allerersten Job während meines Studiums bei einem Computerverlag gearbeitet und meine erste Aufgabe war es, das Fotoarchiv zu sortieren. Damals gab es Dias. Die mussten dann aufwendig in eine Tabelle übertragen und sortiert werden.

Eine Erinnerung an die analoge Welt

Als ich mich also an diese Aufgabe machte, dachte ich an mein Leben im Fotoarchiv. Es war unglaublich langweilig und ich habe nicht besonders viel hingekriegt. Jedenfalls standen da noch mehrere Diastapel, als ich dann zu anderen Aufgaben abberufen wurde.

Aber hier kann KI, die künstliche Intelligenz, helfen. Und zwar, wenn man es richtig macht. Wie wäre es, wenn du alle Bilder einfach in ein Verzeichnis legen könntest, ganz unsortiert? Du würdest ein Skript laufen lassen und dann würde magisch folgendes passieren:

Die magische Lösung mit KI

Jedes Bild wird automatisch in eine von dir vorher festgelegte Kategorie sortiert. Die Bildgröße des Bildes wird angezeigt und der Dateiname wäre eine kurze Beschreibung in maximal fünf Worten, wie “Hund auf einem Fahrrad”. Die Datei würde also dann heißen: Natur, Bildgröße, ein Berg hinter einem Kristallsee. Das Bild mit dem komischen Dateinamen würde dann automatisch in einen Unterordner Processed gelegt.

Und du würdest zusätzlich noch eine Excel-Datei bekommen, in der der Ort der gespeicherten Datei, der alte Dateiname, der neue Dateiname, eine längere Beschreibung des Bildes und auch noch fünf Schlüsselworte verfügbar sind. Für Feinschmecker, die noch mehr machen möchten, wird gleichzeitig auch noch alles in eine Datenbank geschrieben.

Flexibilität durch verschiedene KI-Modelle

Und noch besser: Man kann verschiedene KI-Modelle benutzen, sogar Modelle, die auf deinem eigenen Rechner laufen, sind möglich. Das ist ein Projekt, was kein Mensch anfassen würde. Es würde einfach zu lange dauern und auch die Fehlerwahrscheinlichkeit ist sehr hoch, weil natürlich jeder Mensch eine andere Art hat, Bilder zu beschreiben und zu klassifizieren.

Hier kommt natürlich dann zusätzlich noch die Kunst dazu, denn man muss den Modellen ganz genau erklären, was sie eigentlich tun sollen und vor allen Dingen sicherstellen, dass das auch vernünftig und konsistent wird. Ich habe nun einen Prototypen erstellt und ich finde, es läuft schon sehr zuverlässig und sehr gut.

Ein Prototyp mit Potential

Natürlich kann man da noch an ganz vielen Stellschrauben drehen, aber es funktioniert schon. Wer also mit Bildern zu tun hat und da Ordnung reinbringen möchte und dann im nächsten Schritt, wenn also das alles gemacht, klassifiziert, sortiert und beschrieben ist, dann noch die Bilder in eine besondere Datenbank hineinschreiben, sodass man nicht nur Bilder nach deren Beschreibung, den Keywords, sondern auch noch Bilder finden kann, die ähnlich sind aus diesem ganzen archivierten Teil, dann würde ich mich sehr freuen, mit euch darüber zu sprechen und zu überlegen, wie so etwas nicht in euren Workflow passt, sondern eher, was wir überhaupt machen können.

Denn das ist nur ein Beispiel von eigentlich sehr langweiligen Dingen, die aber das Leben und überhaupt alles verbessern und ich glaube viel mehr als Bling Bling tun.