Während die großen KI-Modelle beeindruckende Ergebnisse bei der Bildergenerierung liefern, stoßen sie bei spezifischen oder lokalen Inhalten oft an ihre Grenzen.
Der Grund: Sie greifen nur auf vortrainierte Datensätze zurück, die private oder nischige Inhalte nicht abbilden können. Das luxemburgische Startup LetzAI hat eine Lösung entwickelt, die es Nutzenden ermöglicht, die KI mit eigenen Assets zu trainieren und so personalisierte Bildinhalte zu generieren.
Die Idee entstand aus einer alltäglichen Beobachtung: Misch Strotz, Mitgründer von Neon Internet, bemerkte bei einem Spaziergang, dass KI-Systeme seine luxemburgische Heimat nie authentisch darstellen können wird, weil ihnen passende Trainingsdaten fehlen. KI-Systeme basieren bisher auf Mainstream-Inhalten und vernachlässigen daher kulturelle oder lokale Inhalte. Dies nahm Strotz zum Anlass, um sein eigenes KI-Programm zu entwickeln.
2023 startete er LetzAI zunächst als regionales Skunkworks-Projekt für luxemburgische Kreative. Der Fokus lag darauf, lokale Architektur, Landschaften und kulturelle Elemente authentisch darzustellen. Nachdem sein Projekt auf positive Resonanz stieß, folgte eine globale Version, in die man eigene Modelle und Community-Inhalte hochladen konnte. Diese Entwicklung zeigte, dass der Bedarf an personalisierbarer KI-Bildgenerierung weit über regionale Anwendungen hinausgeht.
Hohe technische Anforderungen
Aufgrund der neuen globalen Ausrichtung benötigte das Unternehmen eine leistungsfähige GPU-Infrastruktur – trotz der damals herrschenden weltweiten Chip-Knappheit. Diese Herausforderung verstärkte sich durch die gestiegene Nachfrage nach KI-Rechenleistung im Jahr 2023. Bei der Suche nach einem geeigneten Partner sprach Strotz mit großen Anbietern, darunter Hyperscaler und verschiedene europäische Dienstleister. In der Evaluierung verschiedener Anbieter entschied man sich letztlich für Gcore: Ausschlaggebend waren dabei vor allem technologische Kompetenz und der Fokus auf Datensicherheit. Diese flossen in die Entwicklung der Plattform mit ein. Außerdem war das Unternehmen bereit, auch für ein kleines Start-up Budget ein maßgeschneidertes Projekt zu liefern. So startete die zweite Version mit Hilfe der NVIDIA H100 GPU in Luxemburg innerhalb von zwei Monaten. Dabei spielte die geografische Nähe der Rechenzentren eine wichtige Rolle, da sie kurze Latenzzeiten für europäische Nutzer garantierte. Das Team implementierte zudem ein dynamisches Lastverteilungssystem, das die verfügbaren Ressourcen optimal auf die verschiedenen Nutzungsszenarien verteilt.
Skalierbare Infrastruktur
Diese Architektur bewährte sich beim Launch der dritten Version im August 2024, als die Nutzerzahlen stark anstiegen. Die technische Basis ermöglicht es dem Unternehmen, flexibel auf steigende Anforderungen zu reagieren und neue Funktionen, wie einen Bild-Upscaler zu integrieren. Das Team entwickelte dafür ein mehrstufiges Infrastrukturkonzept:
- Die erste Ebene bildet ein Netzwerk aus Edge-Servern, die eingehende Anfragen vorverarbeiten und erste Optimierungen vornehmen. Diese dezentrale Struktur reduziert die Latenzzeiten erheblich, da Nutzende immer mit dem geografisch nächstgelegenen Server kommunizieren.
- Die zweite Ebene besteht aus spezialisierten GPU-Clustern für das KI-Training. Sie übernehmen rechenintensive Aufgaben wie das Trainieren neuer Modelle und die Verarbeitung großer Bilddaten. Spezielle Algorithmen komprimieren und optimieren dabei große Datenmengen effizient. Parallel dazu integriert die Software verschiedene Dateiformate, um beim Asset-Upload unterschiedliche Anforderungen zu berücksichtigen. Ein intelligentes Ressourcenmanagement verteilt die Aufträge automatisch auf verfügbare Kapazitäten, sodass die Antwortzeiten auch bei hoher Auslastung stabil bleiben.
- Die dritte Ebene bildet ein verteiltes Speichersystem für die Assets und trainierten Modelle. Dieses nutzt moderne Caching-Strategien, um häufig verwendete Daten schnell bereitzustellen. Gleichzeitig gewährleistet es durch mehrfache Redundanz eine hohe Ausfallsicherheit. Das System skaliert die Speicherkapazität automatisch je nach Nutzung.
Datenschutz und Kontrolle als zentrale Elemente
LetzAI legt besonderen Wert auf den Umgang mit hochgeladenen Daten. Die Nutzenden behalten die Kontrolle über ihre Assets und bestimmen selbst über deren Verwendung. Dazu gehören Verschlüsselung, granulare Zugriffsrechte und automatische Löschroutinen. Die Software läuft in europäischen Rechenzentren und folgt den geltenden Datenschutzbestimmungen.
Im professionellen Umfeld schätzen besonders Agenturen und Fotografen diesen Ansatz: Sie können kundenspezifische Modelle erstellen oder ihre Bilder weiterentwickeln, ohne die Rechte daran zu verlieren. Die Verbindung von technologischer Innovation und Datenkontrolle ist ein wesentliches Merkmal dieses KI-Systems.
Community als Innovationstreiber
Eine aktive Community von Kreativen verschiedener Bereiche tauscht Erfahrungen aus und experimentiert mit neuen Anwendungen. Dieser Austausch führt zu kontinuierlichen Verbesserungen und erschließt neue Einsatzgebiete. Das Startup unterstützt die Zusammenarbeit durch regelmäßige Updates, Workshops und Events. Die Community entwickelt dabei auch eigene Tools und Workflows, die das Grundsystem erweitern. Diese Bottom-up-Innovation trägt wesentlich zur Weiterentwicklung der Plattform bei.
Ausblick: Personalisierte KI-Bildgenerierung
Das Entwicklungsteam von LetzAI arbeitet stets daran, das System zu erweitern und den Nutzenden zu ermöglichen, die KI direkt in ihre gewohnten Arbeitsabläufe einzubinden. Parallel dazu optimiert das Team die Trainingsalgorithmen, um die Qualität der generierten Bilder weiter zu verbessern.
Künftig wird die erweiterte Bildbearbeitung mehr kreative Möglichkeiten bieten. Dazu zählen etwa fortgeschrittene Stilübertragungen und Anpassungen von Bildern je nach Inhalt. Außerdem wird eine KI-gestützte Qualitätskontrolle automatisch die besten Ergebnisse aus mehreren Vorschlägen auswählen.
Durch eigene Datensätze und den Austausch mit der Community erweitert LetzAI die Möglichkeiten der KI-gestützten Bildproduktion. Die technische Infrastruktur bildet die Grundlage, um das Konzept der personalisierten KI-Bildgenerierung gezielt auszubauen und demokratischer zu gestalten. Datenschutz und Nutzerkontrolle bleiben dabei feste Bestandteile des Angebots.