Jeder kennt die Situation: Die Chefin steht vor der Tür und fragt wie weit Sie mit dem Beitrag sind. Es fehlen noch Stockbilder! Aber woher nehmen wenn nicht stehlen? Anbieter gibt es zu mindestens genug: AdobeStock, Pixabay, Unsplash, Istockfoto, Shutterstock, Pexels, GettyImages und und und… Nun wäre es nicht schön wenn man einfach seinen Fotowunsch aufschreiben könnte und sofort das exakt passende Foto erhalten würde? Klingt ja fast wie Magie!
Wie wäre es zum Beispiel mit: „Einem süßen Corgi, der in einem Sushi-Haus lebt?“

Huch das funktioniert ja echt gut! Und sieht dazu noch fotorealistisch aus. Aber wie funktioniert das Ganze und kann ich es schon verwenden?
Was ist „Imagen“ vom Google-Brains Team?
Imagen ist ein KI-Bildgenerator, der auf einem Text-zu-Bild-Diffusionsmodell basiert. Einfach gesagt verwendet die KI ihr tiefes Sprachverständnis, um aus Text fotorealistische Bilder zu generieren. Dabei wird ein T5 XXL-Encoder zum übersetzen von Textbausteinen verwendet [Google-AI-Blog,2020].
Die Erklärung der exakten Funktionsweise ist aktuell noch nicht im Detail möglich. Experten vermuten allerdings, dass Google eine klare Positionierung gegenüber seinen Mitbewerbern, wie zum Beispiel „DALL-E 2“ von open.ai wagt.
Kann ich Imagen schon verwenden?
Imagen ist aktuell nicht öffentlich – weder die Anwendung noch der Code. Das bedeutet, dass wir uns noch etwas gedulden müssen. Vergleichbare Anwendungen gibt es allerdings schon.
Der Grund dafür ist einfach. Das KI-System zur Fotogenerierung funktioniert zwar, jedoch ist die Angst vor einer illegalen Nutzung des Tools hoch. Wie im Research Paper der Cornell University nachzulesen, wurde das bekannte Datenset LAION-400M verwendet, um nicht gewünschte Inhalte herauszufiltern.
Der Konkurrent open.ai hat bereits eine Warteliste angelegt, um das Tool nutzen zu können. Bei Google’s Imagen müssen wir uns voraussichtlich noch etwas gedulden, bevor der KI-Foto-Spaß losgehen kann.
Fazit: Großes Potential für Online-Unternehmer:innen!
Wir finden, Imagen und andere KI-Bildgeneratoren bieten ein immenses Potential für alle, die ihr Internet-Business automatisieren wollen. Online-Händler:innen könnten zum Beispiel Produktbilder ganz nach ihren Vorlieben innerhalb Sekunden erzeugen und somit teure und zeitaufwendige Fotosessions von ihren monatlichen Ausgaben streichen. Auch für Webdesigner würden zum Beispiel teure Abos für Stock-Foto-Datenbanken entfallen. Aber nicht nur diese Beispiele könnten von den KI-Generatoren profitieren. Die Anwendungsbeispiele sind fast unzählbar! Es ist Definitiv eine Entwicklung, die man weiter verfolgen sollte. Hoffentlich steht dieses Tool bald der Internet-Community zur Verfügung!

Weitere Quellennachweise für technisch Interessierte: